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随 着 计算 资源 的 日 益 丰 富 和 开发 环境 的 日 趋 完 善 ,直接 运用 汇编 语言 编写 程序 的 场合 越 
来 越 少 ,因此 汇编 语言 课程 需要 新 定位 ,汇编 语言 课程 需要 新 概念 。 

在 这 样 的 背景 下 ,本 书 设 定 新 的 目标 ,采用 新 的 方法 ,基于 新 的 平台 ,讲解 IA-32 结构 系列 
(80x86 系列 )CPU 的 32 位 编程 。 学 习 汇 编 语言 的 新 目标 是 深入 理解 计算 机 系统 的 工作 原 
理 ,全 面 提升 高 级 语言 程序 设计 能 力 ,而 不 再 是 熟练 运用 汇编 语言 编写 程序 。 汇 编 语 言 课程 将 
起 到 “上 承 高 级 语言 ,下 启 机 器 系统 ”的 桥梁 作用 。 学 习 汇编 语言 的 新 方法 是 依托 高 级 语言 。 
在 学 习 汇 编 语言 之 前 ,通常 已 经 具备 高 级 语言 (C 或 者 C++ 语言 等 ) 程 序 设计 的 基础 。 通 过 采 
用 艇 入 汇编 和 分 析 目 标 代码 等 方法 ,不 仅 可 以 降低 学 习 和 掌握 汇编 格式 指令 的 难度 ,而 且 有 助 
于 * 知 其 然 , 知 其 所 以 然 ", 有 助 于 更 好 地 掌握 高 级 语言 。 实 践 汇编 语言 的 新 平台 是 虚拟 机 。 目 
前 虚拟 机 已 经 十 分 流行 , 它 是 很 理想 的 “ 裸 机 ”。 基 于 虚拟 机 不 仅 可 以 突破 操作 系统 的 约束 ,为 
所 欲 为 地 操纵 “机 器 ”, 从 而 轻松 调试 设备 驱动 程序 或 者 系统 程序 ,而 且 有 助 于 熟悉 计算 机 系统 
的 启动 过 程 , 有 助 于 明了 计算 机 系统 硬件 和 软件 的 相互 关系 。 

本 书 分 为 4 个 部 分 , 共 10 章 。 第 一 部 分 由 前 五 章 组 成 ,利用 VC 2010 环境 的 嵌入 汇编 和 
目标 代码 ,讲解 IA-32 系列 (80x86 系列 )CPU 的 基本 功能 和 32 位 编程 技术 。 第 1 章 介 绍 基础 
知识 ; 第 2 章 说 明 IA-32 系列 CPU 的 基本 功能 ; 第 3 章 和 第 4 章 讲解 利用 IA-32 系列 CPU 
的 指令 设计 程序 ; 第 5 章 分 析 VC 源 程 序 的 目标 代码 。 第 二 部 分 由 第 6 章 , 第 7 章 和 第 8 章 组 
成 ,利用 汇编 器 NASM 和 虚拟 机 ,讲解 汇编 语言 和 系统 输入 输出 。 第 6 章 基 于 汇编 器 NASM 
介绍 汇编 语言 ; 第 7 章 在 介绍 BIOS 和 主 引 导 记 录 之 后 ,说 明 虚 拟 机 的 原理 及 其 使 用 方法 ; 
第 8 章 基 于 虚拟 机 讲解 计算 机 系统 底层 输入 输出 的 实现 方式 。 第 三 部 分 是 第 9 章 , 详 细 讲 
解 基于 IA-32 系列 CPU 的 保护 方式 程序 设计 ,该 章 内 容 十 分 丰富 。 第 四 部 分 是 第 10 章 , 简 
要 说 明 相关 工具 的 使 用 ,包括 开源 汇编 器 NASM、 开 源 虚拟 机 VirtualBox 和 开源 模拟 器 
Bochs 等 。 

本 书 依托 高 级 语言 ,讲解 低级 语言 ; 利用 虚拟 平台 ,演示 系统 原理 。 第 一 部 分 和 第 二 部 分 
可 作为 学 习 汇编 语言 的 教材 .第 三 部 分 可 作为 学 习 保 护 方式 编程 技术 的 教材 或 参考 书 。 本 书 
还 提供 教学 用 PPT。 

杨 季 文 撰写 第 1 一 4 章 和 第 6 一 9 章 , 朱 晓 旭 撰写 第 5 章 , 胡 沁 涵 撰写 第 10 章 , 赵 雷 参与 部 
分 工作 。 杨 季 文 负责 全 书 统 稿 .定稿 。 
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基础 知识 


利用 计算 机 系统 进行 科学 计算 或 者 信息 处 理 ,本 质 上 是 运行 各 种 程序 。 在 普通 计算 机 系 
统 中 ,由 作为 核心 的 CPU 执行 程序 。 本 章 首先 介绍 CPU 的 基本 功能 ,然后 介绍 汇编 语言 的 
相关 基本 概念 ,最 后 说 明 数 据 的 表示 和 存储 方法 。 


1.1 CPU 简介 


计算 机 系统 的 核心 是 中 央 处 理 器 ,也 就 是 CPU。 本 节 结 合 可 由 IA-32 系列 CPU 执行 的 
目标 代码 ,介绍 CPU 的 基本 功能 。 


1.1.1 目标 代码 


计算 机 系统 中 的 CPU 只 能 执行 机 器 指令 ,也 就 是 说 只 能 运行 由 机 器 指令 组 成 的 程序 。 
利用 相应 的 编译 器 ,可 以 把 由 高 级 语言 编写 的 源 程序 转换 成 由 机 器 指令 组 成 的 程序 ,也 就 是 目 
标 程序 ,又 被 称 为 目标 代码 。 无 论 源 程序 是 用 哪 种 语言 编写 的 ,无 论 程序 是 作为 简单 的 小 软件 
还 是 构成 复杂 的 大 系统 ,计算 机 系统 最 终 运行 的 是 对 应 的 目标 程序 。 

如 下 用 C 语言 编写 的 函数 cf11 的 功能 是 计算 1 至 10 的 平方 和 。 为 了 较 好 地 体现 目标 代 
码 和 反映 CPU 的 功能 ,这 个 函数 采用 循环 累加 1 至 10 之 间 每 个 整数 的 平方 。 为 此 安排 了 两 
个 变量 ,一 个 存放 累加 和 , 另 一 个 用 于 计数 。 


int cf1K void) 
{ 
int sum ji 
SuF 0; 
fo i=1; i <=10; i+=1) 
sumt = i ij; 
return sum; 
} 


利用 微软 Visual Studio 2010 的 VC 集成 开发 环境 ,在 采用 编译 优化 选项 “使 大 小 最 小 化 ” 
的 情况 下 ,编译 上 述 程 序 , 可 得 到 如 下 所 示 的 IA-32 系列 CPU 的 目标 代码 。 为 了 便于 理解 ,这 
里 的 目标 代码 采用 了 汇编 格式 指令 的 表示 形式 ,而 真正 的 目标 代码 是 用 二 进 制 编码 的 。 
xor ecx, ecx 
xor eax, eax 
inc ecx 
$ LL38 cf11: 
mov ed, ecx 





ap ecx, 10 
jle  $U3a cfl1 
ret 

可 以 这 样 认为 ,以 IA-32 系列 处 理 器 为 CPU 的 计算 机 执行 上 述 C 函数 cfl1 ,实际 上 就 是 
执行 这 段 目 标 代码 。 也 就 是 说 ,这 段 目 标 代码 实现 了 C 函数 cfl1 的 功能 。 现 在 结合 上 述 C 函 
数 cfll ,解释 这 段 目标 代码 。 

上 述 目 标 代码 由 10 条 指令 组 成 。 其 中 ,EAX、ECX、EDX 分 别 是 IA-32 系列 CPU 内 部 的 
寄存 器 ,这 些 寄存 器 可 用 于 存放 运算 数据 和 运算 结果 。 这 些 寄存 器 类 似 于 C 语言 源 程序 中 的 
变量 。 

开始 两 条 指令 中 的 XOR 表示 将 两 个 数据 进行 “ 异 或 ”运算 ,两 个 相同 的 数据 进行 “ 异 或 ” 
运算 的 结果 是 0。 所 以 ,执行 指令 “xor ecx， ecx” 就 使 得 寄存 器 ECX 的 值 为 0。 第 三 条 指令 
中 的 INC 表示 将 寄存 器 或 者 存储 单元 的 值 加 1, 执 行 指令 “inc ecx” 就 使 得 寄存 器 ECX 的 值 
加 1。 至 此 可 以 看 到 ,寄存 器 EAX 和 ECX 分 别 代 表 了 函数 cfl1 中 的 变量 sum 和 i, 第 二 条 指 
今 “xor eax，eax” 对 应 语句 “sum 二 0”, 第 一 条 指令 和 第 三 条 指令 一 起 对 应 语句 “i=1”。 

第 四 条 指令 中 的 MOV 表示 将 数据 传送 到 寄存 器 或 存储 单元 。 执 行 指令 “mov edx， 
ecx” 会 把 寄存 器 ECX 的 值 传送 到 寄存 器 EDX。 第 五 条 指令 中 的 IMUL 表示 将 两 个 数据 进行 
相 乘 运算 ,执行 指令 “imul edx,， ecx” 就 使 得 寄存 器 EDX 的 值 和 寄存 器 ECX 的 值 相 乘 ,乘积 
存放 在 寄存 器 EDX 中 ,这 里 实际 上 就 是 计算 平方 。 第 六 条 指令 ADD 表示 将 两 个 数据 进行 相 
加 运算 ,执行 指令 “add eax，edx? 就 使 得 寄存 器 EAX 的 值 和 寄存 器 EDX 的 值 相 加 ,其 和 存 
放 在 寄存 器 EAX 中 。 所 以 ,下 面 3 条 指令 对 应 上 述 函 数 cf11 中 的 语句 "sum 十 一 ix im， 

mov edx, ecx 
imul edx, ecx 
add eax, edx 

第 七 条 指令 仍然 是 “inc ecx”, 执 行 它 使 得 寄存 器 ECX 的 值 加 1。 在 这 里 该 指令 相当 于 
函数 cfll 中 的 语句 “i 十 ==1”。 

接 下 来 的 指令 “cmp ecx, 10” 和 指令 “jle $LL3@cf11” 的 具体 操作 是 把 寄存 器 ECX 的 
值 与 10 进行 比较 , 当 寄 存 器 ECX 的 值 小 于 等 于 10 时 , 跳 转 到 标号 为 $LL3@cfll 的 指令 处 
执行 ,否则 顺序 执行 下 一 条 指令 。 在 这 里 就 是 判断 是 否 要 继续 循环 累加 ,如 果 变 量 i 的 值 没 有 
超过 10, 则 继续 计算 平方 和 。 

最 后 一 条 指令 “ret” 表 示 返 回 到 调用 者 。 在 这 里 就 代表 函数 cfl1 结束 返回 。 

虽然 上 述 目 标 代 码 比 用 C 语言 编写 的 函数 cfll 烦琐 和 难以 理解 ,但 在 计算 机 系统 中 就 是 
这 样 处 理 的 。 通 过 学 习 汇 编 语言 程序 设计 ,可 以 深入 地 理解 计算 机 系统 的 处 理 方式 。 


1.1.2 基本 功能 


CPU 是 计算 机 系统 的 核心 ,无 论 计 算 机 系统 处 理 什 么 ,最 终 都 归结 为 CPU 执行 机 器 指令 
进行 相应 的 运算 或 者 处 理 。 
CPU 的 基本 功能 是 执行 机 器 指令 . 暂 存 少 量 数据 和 访问 存储 器 。 
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1. 执行 机 器 指令 

CPU 能 够 一 条 接 一 条 地 依次 执行 存放 在 存储 器 中 的 机 器 指令 。 也 就 是 说 ,CPU 能 够 自动 执 
行 存放 在 存储 器 中 的 由 若干 条 机 器 指令 组 成 的 目标 程序 或 目标 代码 。 例 如 ,对 于 在 1. 1. 1 节 中 
以 汇编 格式 指令 的 形式 列 出 的 目标 代码 ,CPU 从 执行 指令 “xor ecx，ecx? 开 始 ,依次 顺序 执 
行 随 后 的 各 条 指令 ,在 执行 指令 “jle $LL3@cf1l1” 时 ,如 果 满 足 小 于 等 于 的 条 件 , 就 接着 从 
指令 “mov edx, ecx” 开 始 依次 顺序 执行 ,否则 执行 下 一 条 指令 “ret”。 

CPU 能 够 直接 识别 并 遵照 执行 的 指令 被 称 为 机 器 指令 。 一 款 CPU 能 够 执行 的 全 部 机 器 
指令 的 集合 ,被 称 为 该 CPU 的 指令 集 。 

每 一 条 机 器 指令 的 功能 通常 是 很 有 限 的 。 一 条 高 级 语言 的 语句 所 完成 的 功能 ,往往 需要 
几 条 机 器 指令 ,或 者 几 十 条 机 器 指令 ,甚至 几 百 条 机 器 指令 才能 够 实现 。 例如 ,在 1.1.1 节 C 
函数 cfll 中 ,虽然 语句 “sum 十 二 i* i 六 很 简单 ,并 且 变 量 sum 和 i 分 别 由 寄存 器 担当 ,该 语句 的 
功能 仍 需 要 三 条 机 器 指令 来 实现 。 

CPU 决定 机 器 指令 。 不 同 种 类 的 CPU, 其 指令 集 往往 不 相同 。 有 的 CPU 指令 集 比 较 
小 ,有 的 CPU 指令 集 比较 大 。 但 是 ,同一 个 系列 CPU 的 指令 集 常 常 具 有 良好 的 向 上 兼容 性 ， 
即 下 一 代 CPU 的 指令 集 通 常 是 上 一 代 CPU 指令 集 的 超 集 。 例 如 ,Intel 80386 处 理 器 的 指令 
集 包 含 了 早先 的 8086 处 理 器 的 指令 集 ,Pentium 处 理 器 的 指令 集 包 含 了 Intel 80386 处 理 器 的 
指令 集 。 

按 指令 的 功能 来 划分 ,通常 机 器 指令 可 分 为 以 下 几 大 类 : 数据 传送 指令 .算术 催 辑 运算 指 
令 ,转移 指令 、 处 理 器 控制 指令 和 其 他 指令 等 。 例 如 ,在 1.1.1 节 列 出 的 目标 代码 片段 中 ， 
MOYV 指令 属于 数据 传送 指令 ,ADD 指令 、IMUL 指令 INC 指令 属于 算术 运算 指令 ,XOR 指 
令 属 于 逻辑 运算 指令 ,JLE 指令 和 RET 指令 属于 转移 指令 。 

2. 暂 存 少量 数据 

一 个 目标 程序 中 的 绝 大 部 分 指令 是 对 数据 进行 各 种 运算 或 者 处 理 。 例 如 ,在 1. 1.1 节 列 
出 的 目标 代码 片段 中 ,共计 10 条 指令 ,有 8 条 是 对 数据 进行 运算 或 者 处 理 的 。 参 与 运算 的 数 
据 存放 在 哪里 ? 运算 的 结果 存放 在 哪里 ? 一 般 来 说 ,运算 数据 和 运算 结果 可 以 存放 在 寄存 器 
中 ,也 可 以 存放 在 存储 器 中 。 

CPU 有 若干 个 寄存 器 ,可 以 用 于 存放 运算 数据 和 运算 结果 。 例 如 ,在 1.1.1 节 列 出 的 目 
标 代码 片段 中 ,就 充分 运用 了 寄存 器 EAX、ECX、EDX 存放 运算 数据 和 运算 结果 ,寄存 器 EAX 
和 ECX 分 别 作 为 变量 sum 和 i。 

利用 寄存 器 存放 运算 数据 和 运算 结果 ,效率 是 最 高 的 。 寄 存 器 在 CPU 内 部 ,处 理 寄存 器 
中 的 数据 要 比 处 理 存 储 器 中 的 数据 快 得 多 ,因此 一 般 总 是 尽量 利用 寄存 器 。 这 也 就 是 为 什么 
在 C 函数 cfll 的 目标 代码 中 用 两 个 寄存 器 分 别 作为 局 部 变量 的 原因 。 在 采用 编译 优化 选项 
“使 大 小 最 小 化 ”的 情况 下 ,VC 2010 编译 器 生成 这 样 的 目标 代码 ; 否则 ,在 默认 情况 下 ,采用 


存储 单元 存放 普通 局 部 变量 。 
指令 集中 大 部 分 指令 的 操作 数据 至 少 有 一 个 在 寄存 器 中 。 在 目标 程序 中 , 绝 大 部 分 的 指 
令 都 使 用 到 寄存 器 。 


但 是 ,CPU 内 可 用 于 存放 运算 数据 和 运算 结果 的 寄存 器 数量 是 很 有 限 的 。 例 如 ,IA-32 
系列 CPU 只 有 8 个 这 样 的 通用 寄存 器 。 通 常 ,编译 器 会 充分 利用 CPU 内 的 寄存 器 。 在 用 汇 
编 语言 编写 程序 时 ,也 必须 注意 灵活 运用 寄存 器 。 


新 概念 汇编 语言 





3. 访问 存储 器 
由 机 器 指令 组 成 的 目标 程序 在 存储 器 中 , 待 处 理 的 数据 也 在 存储 器 中 ,CPU 要 执行 目标 
程序 ,就 要 访问 存储 器 。 这 里 存储 器 指 CPU 能 够 直接 访问 的 计算 机 系统 的 物理 内 存 。 
存储 器 (内 存 ) 由 一 系列 存储 单元 线性 地 组 成 ,最 基本 的 存储 单元 为 一 个 字 节 。 为 了 标识 
和 存 取 每 一 个 存储 单元 ,给 每 一 个 存储 单元 规定 一 个 编号 ,也 就 是 存储 单元 地 址 。 
通常 ,CPU 支持 以 多 种 形式 表示 存储 单元 的 地 址 。 一 些 功能 较 强 的 CPU 还 支持 以 多 种 
方式 组 织 管理 存储 器 。 
设 有 以 下 CC 程序 片 段 , 其 中 xz 和 y 是 两 个 全 局 变量 ,函数 cfl2 进行 简单 的 数据 处 理 。 
int © 1; 
int y 2; 
void cf12 void) 
Fx xt3; 
return; 
} 
利用 微软 Visual Studio 2010 的 VC 集成 开发 环境 ,在 采用 编译 优化 选项 “使 大 小 最 小 化 ” 
的 情况 下 ,编译 上 述 程序 ,对 应 C 函数 cf12 的 目标 代码 如 下 所 示 。 为 便于 理解 ,目标 代码 采用 
汇编 格式 指令 的 表示 形式 。 
mv eax varx3HA 
imul eax, eax 
add eax 3 
mov vary3A eax 
ret 
在 上 述 以 汇编 格式 指令 的 形式 表示 的 目标 代码 中 ,符号 varx3HA 和 vary3HA 分 别 代表 
存放 全 局 变量 x 和 >y 的 存储 单元 。 指 令 “mov eax,varx3HA” 的 功能 是 把 全 局 变量 x 所 在 的 
存储 单元 的 内 容 取 到 寄存 器 EAX 中 , 换 句 话 说 就 是 把 内 存 中 的 全 局 变量 z 送 到 寄存 器 EAX。 
类 似 地 ,指令 “MOV vary3HA ,eax” 的 功能 是 把 寄存 器 EAX 中 的 内 容 送 到 全 局 变量 > 中 。 
运行 函数 cf12 ,就 是 执行 上 面 的 这 些 指令 。 在 执行 指令 “mov eax,varx3HA” 后 ,寄存 器 
EAX 就 含有 变量 z 的 值 ; 执行 指令 “imul eax,eax”, 实 现 把 寄存 器 EAX 与 EAX 相 乘 ,这样 
寄存 器 EAX 就 有 xx x 的 积 ; 执行 指令 "add ”eax,3”, 使 寄存 器 EAX 所 含 值 再 加 3; 执行 指 
邻 “mov vary3HA,eax”, 把 最 后 的 结果 送 到 变量 y; 执行 指令 “ret”, 从 函数 返回 。 


1.2 汇编 语言 概念 
由 CPU 执行 的 机 器 指令 采用 二 进 制 编码 ,人 们 很 难 识别 和 理解 ,为 此 采用 符号 表示 ,成 
为 汇编 格式 指令 。 本 节 在 介绍 机 器 指令 和 汇编 格式 指令 的 基础 上 ,介绍 汇编 语言 的 概念 。 


1.2.1 机 器 指令 


把 CPU 能 够 直接 识别 并 遵照 执行 的 指令 称 为 机 器 指令 。 
机 器 指令 一 般 由 操作 码 和 操作 数 两 部 分 构成 。 操 作 码 指出 要 进行 的 操作 或 运算 ,如 加 、 
减 , 传 送 等 。 操 作 数 指出 参与 操作 或 运算 的 对 象 ,也 指出 操作 或 运算 结果 存放 的 位 置 ,如 寄存 
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器 ,存储 单元 和 数据 等 。 
机 器 指令 采用 二 进 制 编码 表示 。 换 句 话 说 ,就 是 用 二 进 制 代 码 表示 机 器 指令 。 例 如 ,把 通 
用 寄存 器 EAX 与 EDX 相 加 ,结果 存放 到 EAX 中 的 机 器 指令 如 下 所 示 : 
0000 0011 11 00 010 
对 机 器 指令 的 编码 是 按 一 定 规则 进行 的 。 编 码 中 有 一 部 分 代表 操作 码 , 还 有 一 部 分 代表 
操作 数 。 例 如 ,对 于 上 述 的 编码 ,前 面 的 8 位 (0000 0011) 代 表 加 法 操作 ,也 就 是 操作 码 部 分 ; 
后 面 的 8 位 (11 000 010) 代 表 两 个 通用 寄存 器 EAX 和 EDX, 也 就 是 操作 数 部 分 。 
为 了 阅读 和 书写 方便 ,常用 十 六 进 制 形式 或 八进制 形式 表示 二 进 制 编码 的 机 器 指令 。 例 
如 ,1.1.1 节 所 列 的 C 函数 cfll ,在 经 过 VC 2010 编译 后 得 到 如 下 所 示 的 真正 的 目标 代码 ,其 
中 ,每 一 行 分 别 是 采用 十 六 进 制 形式 表示 的 IA-32 系列 CPU 的 机 器 指令 。 
30 
30 
4 
B80 
CFAFDI 


08 C2 ;0000 0011 11 000 010 
4 


ER 
03 
上 述 目标 代码 片段 犹如 天 书 , 几 乎 没有 人 能 直接 看 出 它 的 功能 。 因 此 ,程序 员 难 以 用 机 器 
指令 编写 程序 ,更 难 写 出 健壮 的 程序 ; 用 机 器 指令 编写 出 的 程序 也 不 易 被 人 们 理解 ,记忆 和 交 
流 。 所 以 ,只 是 在 计算 机 出 现 早期 时 才 用 机 器 指令 编写 程序 ,现在 几乎 没有 人 用 机 器 指令 编写 
程序 了 。 


1.2.2 汇编 格式 指令 


为 了 克服 机 器 指令 的 上 述 缺 点 ,人 们 采用 便于 记忆 、 并 能 描述 指令 功能 的 符号 来 表示 指令 
的 操作 码 。 这 些 符号 被 称 为 指令 助 记 符 。 助 记 符 一 般 是 说 明 指 令 功 能 的 英语 词汇 或 者 词汇 的 
缩写 。 例 如 ,前 面 所 见 的 符号 MOV 和 ADD 等 。 同 时 ,也 用 符号 表示 操作 数 , 如 寄存 器 ,存储 
单元 地 址 等 。 这 样 就 有 了 汇编 格式 指令 。 

用 指令 助 记 符 、 地 址 符号 等 表示 的 指令 称 为 汇编 格式 指令 。 汇 编 格式 指令 的 一 般 格式 
如 下 : 

[标号 : ] 指令 助 记 符 [ 操作 数 表 ] 

其 中 ,指令 助 记 符 是 必需 的 。 操 作 数 随 指令 而 定 , 有 的 指令 有 一 个 操作 数 , 有 的 指令 有 两 
个 操作 数 , 有 些 指 令 有 3 个 操作 数 ,还 有 些 指 令 没 有 操作 数 。 如 果 有 多 个 操作 数 , 操 作 数 之 间 
用 逗号 分 隔 。 标 号 可 有 可 无 ,标号 后 带 一 个 冒号 。 指 令 助 记 符 与 操作 数 表 之 间 用 空格 或 制 表 
符 分 隔 。 

汇编 格式 指令 与 机 器 指令 一 一 对 应 。 例 如 ,1.1. 1 节 所 列 的 C 函数 cfll 的 机 器 指令 和 汇 
编 格式 指令 的 对 应 情况 如 下 所 示 ( 为 了 对 齐 效果 把 标号 $ LL3@cf11 换 成 了 标号 lab1): 


308 ; Xxor ecx, ecx 





3300 xor eax, eax 
4 ; inc ecx 
B00 ; labl: mov edx, ecx 
CFAFDI imul edx, ecx 
08 C2 add eax, edx 
4 ; inc ecx 
BP + ap ecx 10 
ER jle labl 
0C3 ret 


显然 ,汇编 格式 指令 比 二 进 制 编码 的 机 器 指令 要 容易 被 理解 和 掌握 。 
1.2.3 汇编 语言 及 其 优 缺 点 


自然 语言 是 思维 的 载体 ,是 人 与 人 之 间 交 流 的 工具 。 程 序 设计 语言 是 人 与 计算 机 之 间 交 
流 的 工具 。 

程序 设计 语言 由 语句 和 使 用 语句 的 规则 组 成 。 

1. 汇编 语言 

汇编 语言 是 一 种 程序 设计 语言 ,是 用 符号 表示 的 机 器 语言 。 汇 编 语 言 的 语句 是 汇编 格式 
指令 和 伪 指 令 。 伪 指令 的 概念 留待 以 后 介绍 。 

由 于 汇编 语言 的 主体 是 汇编 格式 指令 ,而 汇编 格式 指令 又 与 机 器 密切 相关 , 且 功 能 有 限 ， 
因此 常 把 汇编 语言 称 为 低级 语言 。 虽 然 汇编 格式 指令 要 比 机 器 指令 容易 被 理解 和 掌握 ,但 汇 
编 语言 有 许多 不 足 , 于 是 慢 慢 地 就 出 现 了 各 种 各 样 的 高 级 程序 设计 语言 。 

把 用 汇编 语言 编写 的 程序 称 为 汇编 语言 源 程序 或 汇编 源 程序 ,简称 源 程序 。 

2. 汇编 和 汇编 程序 

由 于 CPU 只 能 识别 和 执行 机 器 指令 ,因此 必须 把 由 汇编 格式 指令 组 成 的 源 程序 翻译 成 
由 机 器 指令 组 成 的 目标 程序 后 才能 由 CPU 执行 。 把 汇编 源 程序 翻译 成 目标 程序 的 过 程 称 为 
汇编 。 完 成 汇编 工作 的 工具 或 程序 称 为 汇编 程序 。 请 注意 ,汇编 程序 和 汇编 源 程序 是 两 个 不 
同 的 概念 。 为 了 避免 混淆 ,常常 把 工具 软件 汇编 程序 称 为 汇编 器 。 汇 编 过 程 如 图 1. 1 所 示 。 





汇编 程序 (汇编 器 ) 


| 
汇编 源 程序 一 (一 目标 程序 

















图 1.1 汇编 过 程 示意 图 


汇编 程序 (汇编 器 ) 与 编译 程序 (编译 器 ) 类 似 ,汇编 过 程 与 编译 过 程 类 似 。 

3. 汇编 语言 的 优 缺 点 

汇编 语言 的 主要 优点 是 利用 它 可 能 编写 出 在 时空” 两 个 方面 最 有 效率 的 程序 。 另 外 , 通 
过 它 可 最 直接 和 最 有 效 地 操纵 机 器 硬件 系统 。 

汇编 语言 的 主要 缺点 是 它 面向 机 器 ,与 机 器 关系 密切 , 它 要求 程 序 员 比 较 熟 悉 机 器 硬件 系 
统 , 要 考虑 许多 细节 问题 。 最 终 导致 程序 员 编写 程序 烦琐 ,调试 程序 困难 ,维护 ,交流 和 移植 程 
序 更 困难 。 
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正 是 由 于 汇编 语言 与 机 器 关系 密切 , 才 使 汇编 语言 具有 其 他 高 级 语言 所 不 具备 的 上 述 优 
点 。 为 了 利用 汇编 语言 的 优点 ,必须 付出 相应 的 代价 。 但 汇编 语言 的 每 一 个 优点 常常 闪耀 出 
诱 人 的 光芒 ,使 人 们 和 勇敢 地 面 对 它 的 缺点 。 


1.3 数据 的 表示 和 存储 


熟悉 数据 在 计算 机 内 的 表示 形式 和 存储 方式 是 掌握 汇编 语言 程序 设计 的 关键 之 一 ,也 是 
透彻 理解 计算 机 系统 工作 原理 的 前 提 。 本 节 先 介绍 简单 数据 的 表示 形式 和 类 型 ,然后 再 介绍 
数据 在 内 存 中 的 存储 方式 。 

计算 机 系统 中 存储 信息 的 最 小 单位 称 为 位 (bit) . 它 只 能 表示 两 种 状态 。 这 两 种 状态 可 分 
别 代表 0 和 1。 计算 机 系统 内 部 采用 二 进 制 表示 数值 数据 ,采用 二 进 制 编码 表示 非 数值 数据 ， 
也 采用 二 进 制 编码 表示 机 器 指令 ,其 主要 原因 就 在 于 此 。 


1.3.1 数值 数据 的 表示 


所 谓 数值 数据 就 是 数 , 有 度量 含义 的 数 。 这 里 仅 简单 介绍 定点 整数 的 有 关内 容 。 

1. 数 的 二 进 制 表示 

尽管 日 常生 活 中 大 多 采用 十 进 制 计 数 , 但 在 计算 机 内 却 采 用 二 进 制 表示 。 

某 个 二 进 制 整数 00,-: 2 加 所 表示 的 数值 用 十 进 制 数 来 衡量 时 ,可 利用 以 下 按 权 相 加 
的 方法 计算 得 到 : 

Bn2" 十 bs-12”! 十 … 十 bz2? 十 b12! 十 bo2° 

反之 ,十 进 制 整数 也 可 以 用 二 进 制 数 表示 。 

在 书写 时 ,为 了 与 十 进 制 数 相 区 别 ,通常 在 二 进 制 数 后 加 一 个 字母 B。 

2. 有 符号 数 的 补 码 表示 

为 了 方便 地 表示 负数 和 容易 地 实现 减法 操作 ,往往 采用 补 码 形式 表示 有 符号 数 。 所 以 ,有 
符号 数 二 进 制 表示 的 最 高 位 是 符号 位 ,0 表示 正 数 ,1 表示 负数 。 正 数 数值 的 补 码 形式 同 二 进 
制 表 示 。 为 得 到 一 个 负数 数值 的 补 码 形式 ,可 以 采用 这 样 的 方法 : 先 得 出 该 负数 所 对 应 正 数 
的 二 进 制 表示 形式 ,然后 把 每 一 个 二 进 制 位 取 反 ,最 后 再 将 取 反 的 结果 加 上 1 。 

【 例 1-1】 一 组 十 进 制 整数 的 二 进 制 补 码 表示 如 下 ,位 于 右边 的 二 进 制 补 码 采用 8 位 
形式 : 





3 ;00000011 
—3 ;11111101 
65 ; 01000001 
一 65 ;10111111 
3. 符号 扩展 
常常 需要 把 一 个 位 二 进 制 数 扩展 成 m 位 二 进 制 数 (mx) 。 当 要 扩展 的 数 是 无 符号 数 
时 ,只 要 在 最 高 位 前 扩展 mm 一 n 个 0。 如 果 要 扩展 的 数 是 有 符号 数 ,并 且 采 用 补 码 形式 表示 , 那 
么 只 要 进行 符号 位 的 扩展 即 可 。 
【 例 1-2〗 十 进 制 数 21 的 8 位 、16 位 和 32 位 的 二 进 制 补 码 如 下 : 
00010101 8 位 
0000000000010101 16 位 
00000000000000000000000000010101 32 位 
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【 例 1-3】 十 进 制 数 一 5 的 8 位 、16 位 和 32 位 的 二 进 制 补 码 如 下 : 
11111011 8 位 
1111111111111011 16 位 
11111111111111111111111111111011 32 位 
4. 数值 数据 的 表示 范围 
nn 位 二 进 制 数 能 够 表示 的 无 符号 整数 的 范围 如 下 : 
0<I<2"—1 
当 采 用 补 码 形式 表示 有 符号 数 时 ,那么 位 二 进 制 数 能 够 表示 的 有 符号 整数 的 范围 如 下 : 
一 22 委 要 十 2 一 1 
表 1.1 列 出 了 分别 是 8 位 16 位 和 32 位 时 ,n 位 二 进 制 数 能 够 表示 的 无 符号 整数 的 范 
围 和 有 符号 整数 的 范围 。 














表 1.1 8 位 16 位 和 32 位 二 进 制 数 的 表示 范围 





二 进 制 位 数 无 符号 数 有 符号 数 
8 0 一 255 一 128 一 十 127 
16 0 一 65 535 一 32 768 一 十 32 767 
32 0~4 294 967 295 一 2 147 483 648 一 十 2 147 483 647 
5. BCD 码 


虽然 二 进 制 数 实现 容易 ,并 且 二 进 制 运算 规律 简单 ,但 不 符合 人 们 的 使 用 习惯 ,书写 阅读 
都 不 方便 。 所 以 在 计算 机 输入 输出 时 通常 还 是 采用 十 进 制 数 来 表示 ,这 就 需要 实现 十 进 制 与 
二 进 制 间 的 转换 。 为 了 转换 方便 , 常 采 用 二 进 制 编码 的 十 进 制 ,简称 BCD 码 (Binary Coded 
Decimal) 。 

BCD 码 就 是 用 4 位 二 进 制 数 编码 表示 一 位 十 进 制 数 。 表 示 的 方法 可 有 多 种 ,常用 的 是 
8421 BCD 码 , 它 的 表示 规则 如 表 1. 2 所 示 。 从 表 1. 2 可 见 ,8421 BCD 码 非常 自然 和 简单 。 


表 1.2 十 进 制 数 的 8421 BCD 码 





十 进 制 数 8421 BCD 码 十 进 制 数 8421 BCD 码 
0 0000 5 0101 
0001 6 0110 
2 0010 7 0111 
3 0011 8 1000 
4 0100 9 1001 





【 例 1-4】 十 进 制 数 2015 用 8421 BCD 码 表示 成 0010 0000 0001 0101 ,每 组 4 位 二 进 制 
数 之 间 是 二 进 制 的 ,但 组 与 组 之 间 是 十 进 制 的。 与 十 进 制 数 2015 等 值 的 二 进 制 数 是 
11111011111, 采 用 16 位 二 进 制 数 表示 就 是 0000011111011111。 

6. 十 六 进 制 表 示 

由 于 二 进 制 数 的 基数 太 小 ,因此 书写 和 阅读 都 不 够 方便 。 而 十 六 进 制 数 的 基数 16 等 于 2 
的 4 次 宕 ,于 是 二 进 制 数 与 十 六 进 制 数 之 间 能 方便 地 转换 , 即 4 位 二 进 制 数 对 应 一 位 十 六 进 制 
数 ,或 者 一 位 十 六 进 制 数 对 应 4 位 二 进 制 数 。 因 此 ,人 们 常常 把 二 进 制 数 改 写成 十 六 进 制 数 ， 
在 汇编 语言 中 尤其 如 此 。 
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在 书写 时 ,为 了 区 别 于 十 进 制 数 和 二 进 制 数 ,通常 在 十 六 进 制 数 后 加 一 个 字母 H。 


1.3.2 非 数 值 数据 的 表示 


计算 机 除了 处 理 数 值 数据 外 ,还 要 处 理 大 量 的 非 数 值 数 据 ,如 文字 信息 和 图 表 信 息 等 ,为 
此 必须 对 非 数值 数据 进行 编码 ,这 样 不 仅 使 计算 机 能 够 方便 地 处 理 和 存储 它们 ,而 且 还 可 以 赋 
予 它 们 数值 数据 的 某 些 属性 。 这 里 仅 介绍 ASCII 码 和 变形 国标 码 。 

1. ASCII 码 

ASCII 码 是 美国 信息 交换 标准 码 (American Standard Code for Information Interchange) 
的 简称 ,是 国际 上 比较 通用 的 字符 二 进 制 编码 。 在 计算 机 系统 中 普遍 采用 它 作为 西 文字 符 的 
编码 。 

ASCII 码 是 7 位 二 进 制 编 码 , 表 1. 3 给 出 了 ASCII 码 表 ( 编 码 与 字符 的 对 应 关系 ) 。 

从 表 1.3 可 知 , 它 对 94 个 常用 的 一 般 符号 进行 了 编码 ,其 中 包括 26 个 英文 字母 的 大 小 写 
符号 、10 个 数字 符号 和 32 个 其 他 符号 。 空 格 (SP) 也 作为 一 个 符号 ,其 编码 是 20H , 它 介 于 一 
般 符号 和 32 个 控制 符 之 间 。 码 值 小 于 20H 的 是 控制 符号 ,如 回 车 符号 的 码 值 是 0ODH ,用 符号 
CR 表示 。 所 有 这 些 一 般 符号 和 控制 符 统 称 为 字符 。 

从 表 1. 3 还 可 知 , 十 进 制 数字 的 编码 .大写 字母 的 编码 和 小 写字 母 的 编码 分 别 是 连续 的 ， 
所 以 只 要 记 住 十 进 制 数字 的 编码 从 30H 开始 ,大写 字母 的 编码 从 41H 开始 和 小 写字 母 的 编 
码 从 61H 开始 ,那么 就 可 推出 其 他 数字 符 和 字母 的 编码 。 还 有 以 下 规律 : 十 进 制 数字 的 编码 
就 是 对 应 十 进 制 数字 值 加 上 30H; 对 应 大 小 写字 母 的 编码 相差 20H, 如 字母 “E? 的 编码 是 
45H ,字母 “e” 的 编码 是 65H。 


表 1.3 ASCII 码 表 





















































高 位 000 001 010 011 100 101 110 111 
低位 0 1 2 3 4 5 6 ? 
0000 0 NUL DEL sp 0 @ P p 
0001 1 SOH DC1 ! 1 A Q a q 
0010 2 SEX DC2 a 2 B R b r 
0011 3 PTX DC3 ## 3 人 S c s 
0100 4 EOT DC4 $ 4 D 和 d t 
0101 5 ENQ NAK % 5 E U e u 
0110 6 ACK SYN & 6 F V f v 
0111 : BEL ETB 7 G Ww g w 
1000 8 BS CAN 8 H 这 h x 
1001 9 HT EM ) 9 I v i y 
1010 A LF SUB 关 : | 2 j z 
1011 B VT ESC 十 K [ k { 
1100 Ce FF FS < L X 1 | 
1101 D CR GS 一 一 M ] m } 
1110 E SO RS 全 N n 一 
1111 F SI US / 9 O o DEL 





























由 于 ASCII 码 仅 采用 7 位 二 进 制 进行 编码 , 故 最 多 表示 128 个 字符 。 这 往往 不 能 满足 使 
用 要 求 。 为 此 在 许多 计算 机 系统 中 ,使 用 扩展 的 ASCII 码 。 扩 展 的 ASCII 码 采用 8 位 二 进 制 
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进行 编码 ,这样 可 表示 256 个 字符 。 另 外 ,在 扩展 的 ASCII 码 中 ,控制 符 所 对 应 的 编码 同时 也 
表示 其 他 图 形 符号 。 

2. 变形 国标 码 

有 了 ASCII 码 ,计算 机 就 能 处 理 数字 、 字 母 等 字符 ,但 还 不 能 处 理 汉字 符 。 为 了 使 计算 机 
能 够 处 理 汉字 信息 ,就 必须 对 汉字 进行 编码 。 我 国 在 1981 年 5 月 对 6000 多 个 常用 汉字 制定 
了 交换 码 的 国家 标准 , 即 GB2312 一 1980《 信 息 交 换 用 汉字 编码 字符 集 一 一 基本 和 集 )。 该 标准 
规定 了 汉字 信息 交换 用 的 基本 汉字 符 和 一 般 图 形 字符 ,它们 共计 7445 个 ,其 中 汉字 分 成 两 级 
共计 6763 个 。 该 标准 同时 也 给 定 了 它们 的 二 进 制 编码 , 即 国标 码 。 

国标 码 是 16 位 编码 ,高 8 位 表示 汉字 符 的 区 号 , 低 8 位 表示 汉字 符 的 位 号 。 实 际 上 ,为 了 
给 汉字 符 编码 ,该 标准 把 代码 表 分 成 94 个 区 ,每 个 区 有 94 个 位 。 区 号 和 位 号 都 从 21H 开始 。 
一 级 汉字 安排 在 30H 区 至 57H 区 ,二 级 汉字 安排 在 58H 区 至 77H 区 。 

在 计算 机 系统 中 ,普遍 支持 变形 国标 码 作为 汉字 的 编码 。 变 形 国标 码 是 16 位 编码 , 顾 名 
思 义 它 是 国标 码 的 变形 。 用 得 最 多 的 变形 方法 是 把 国标 码 的 第 15 位 和 第 7 位 均 置 成 1, 由 于 
国标 码 中 第 15 位 和 第 7 位 都 是 0, 因 此 这 种 变形 方法 实际 上 就 是 在 国标 码 上 加 8080H。 例 
如 , 排 第 一 的 “ 啊 ” 字 编码 是 BOA1H , 紧 随 其 后 “ 阿 ” 字 的 编码 是 BOA2H 。 

尽管 16 位 的 变形 国标 码 与 两 个 字 节 扩展 ASCII 码 的 组 合 有 冲突 ,但 在 相关 系统 模块 的 
支持 下 , 它 有 效 地 实现 了 汉字 在 计算 机 内 的 表示 。 


1.3.3 基本 数据 类 型 


计算 机 存 取 的 以 二 进 制 位 表示 的 信息 位 数 一 般 是 8 的 倍数 ,它们 有 专门 的 名 称 。 

1. 字 节 

一 个 字 节 (Byte) 由 8 个 二 进 制 位 (bit) 组 成 。 把 字 节 的 最 低位 称 为 第 0 位 ,最 高 位 称 为 第 
7 位 ,如 图 1.2(a) 所 示 。 

如 果 用 一 个 字 节 来 表示 一 个 无 符号 数 ,那么 表示 范围 为 0 一 255; 如 表示 有 符号 数 , 则 表示 
范围 为 一 128 一 十 127。 一 个 字 节 足以 表示 一 个 ASCII 字符 ,也 可 以 表示 一 个 扩展 的 ASCII 
字符 。 

另外 ,一 个 字 节 可 分 成 两 个 4 位 的 位 组 , 称 为 半 字 节 。 

2. 字 

一 个 字 由 两 个 字 节 组 成 ,也 就 是 说 一 个 字 含 有 16 个 二 进 制 位 。 如 图 1. 2(b) 所 示 ,把 字 的 
最 低位 称 为 第 0 位 ,最 高 位 称 为 第 15 位 。 同 时 ,把 字 的 低 8 位 称 为 低 字 节 , 高 8 位 称 为 高 
字 节 。 

由 于 一 个 字 由 16 个 二 进 制 位 组 成 ,因此 用 一 个 字 来 表示 无 符号 数 , 则 表示 范围 为 0 一 
65 535; 如 表示 有 符号 数 , 则 表示 范围 为 一 32768 一 十 32767。 一 个 字 ( 两 个 字 节 ) 也 可 以 表示 
一 个 采用 变形 国标 码 的 汉字 。 

注意 ,有 时 字 是 涉及 处 理 器 一 次 能 够 处 理 的 信息 量 的 一 个 术语 , 字 长 是 衡量 处 理 器 品质 的 
一 个 重要 指标 。 

3. 双 字 

双 字 由 两 个 字 组 成 , 即 包含 32 个 二 进 制 位 。 如 图 1. 2(c) 所 示 ,把 其 最 低位 称 为 第 0 位， 
最 高 位 称 为 第 31 位 。 同 时 ,把 低 16 位 称 为 低 字 ,高 16 位 称 为 高 字 。 双 字 能 表示 的 数 的 范围 
更 大 。 
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(a) 一 个 字 节 8 个 位 
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ww 
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ww 
避 
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1514131211109 8 
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31 30 29 28 2726252423222120191817161514131211109 876543 
(©) 一 个 双 字 32 个 位 


图 1.2 字 节 、 字 和 双 字 


IA-32 系列 CPU 是 32 位 的 ,所 以 使 用 得 最 多 的 数据 类 型 是 双 字 或 32 位 数据 。 

4. 四 字 

四 字 就 是 由 4 个 字 组 成 的 ,包含 64 个 二 进 制 位 。 如 果 双 字 还 不 能 表达 所 需要 的 数值 精 
度 ,那么 四 字 也 许 就 能 解决 问题 了 。 

5. 十 字 节 

十 字 节 就 和 它 的 名 称 一 样 ,由 10 个 字 节 组 成 , 含 80 个 二 进 制 位 。 可 用 于 存储 非常 大 的 数 
或 表示 较 多 的 信息 。 

6. 字符 串 

字符 串 是 指 由 字符 构成 的 一 个 线性 数组 。 通 常 每 个 字符 用 一 个 字 节 表示 ,但 有 时 每 个 字 
符 也 可 由 一 个 字 或 一 个 双 字 来 表示 。 


1.3.4 数据 的 存储 


数据 的 存储 是 指 以 二 进 制 形式 表示 的 数据 和 代码 存放 在 存储 器 或 者 内 存 中 。 

内 存 由 一 系列 基本 存储 单元 线性 地 组 成 ,每 一 个 基本 存储 单元 有 一 个 唯一 的 地 址 。 通 常 ， 
基本 存储 单元 由 8 个 连续 的 位 构成 ,可 用 于 存储 一 个 字 节 的 数据 。 所 以 ,基本 存储 单元 也 被 称 
为 字 节 存储 单元 。 可 以 把 内 存 看 作为 一 个 很 大 的 一 维 字符 数组 ,把 地 址 看 作为 标识 数组 元 素 
的 下 标 。 

字 节 存储 单元 是 基本 的 存储 单元 。 一 个 字 节 数据 存储 在 一 个 字 节 存储 单元 中 。 如 图 1. 3 
所 示 ,每 一 个 字 节 存 储 单元 存放 8 位 数据 ,为 了 便于 表示 ,采用 了 十 六 进 制 形式 。 其 中 ,字母 HH 
表示 十 六 进 制 。 

每 一 个 字 节 存储 单元 中 的 8 位 数据 的 意义 ,根据 需要 可 以 有 不 同 的 解释 。 

【 例 1-5】 如 图 1. 3 所 示 ,地 址 为 00001H 的 字 节 存储 单元 中 的 数据 可 以 解释 成 数 57( 十 
六 进 制 的 39H 为 十 进 制 的 57) ,也 可 以 解释 成 字符 9( 字 符 9 的 ASCII 码 是 39H)。 地 址 为 
0000DH 字 节 存储 单元 中 的 8 位 数据 FFH, 可 以 解释 成 无 符号 整数 255 ,也 可 以 解释 成 有 符号 
数 一 1( 一 1 的 8 位 补 码 表示 为 FFEH)。 这 里 H 表示 十 六 进 制 。 

















(b) 一 个 字 16 个 位 
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0000FH FF 
0000EH FF 
0000DH FF 
0000CH 82 
0000BH 00 地 址 0009H 处 
字 单 元 值 为 82 2 

0000AH ol 双 字 单元 值 为 82000102H 
O09 02 地 址 0008H 处 
00008H 03 双 字 单元 值 为 00010203H 
00007H 00 
00006H 00 
00005H 00 
00004H 66 地 址 0003H 处 
00003H 41 上 字 单 元 值 为 6641H 

六 3 | 地 址 0002H 处 
| 字 单 元 值 为 4135H 
00001H 39 
00000H 45 


图 1.3 数据 存储 示意 


两 个 连续 的 字 节 存储 单元 构成 一 个 字 存 储 单元 , 字 存 储 单元 的 地 址 是 较 低 的 字 节 存储 单 
元 的 地 址 。 字 存储 单元 可 以 用 于 存放 一 个 字 (16 位 ) 数 据 。 在 存 取 字 存储 单元 时 ,IA-32 系列 
CPU 按 “高 高 低 低 ” 规 则 进行 ,也 就 是 说 , 低 字 节 ( 低 8 位 ) 对 应 地 址 较 低 的 字 节 存储 单元 ,高 字 
节 ( 高 8 位 ) 对 应 地 址 较 高 的 字 节 存储 单元 。 换 句 话说 ,在 把 一 个 16 位 的 字数 据 存储 到 一 个 字 
存储 单元 中 时 , 低 8 位 存储 在 地 址 较 低 的 基本 存储 单元 ,高 8 位 存储 在 地 址 较 高 的 基本 存储 
单元 。 

【 例 1-6】 如 图 1. 3 所 示 , 地 址 为 00002H 的 字 存 储 单元 中 的 数据 是 4135H, 其 中 , 低 8 位 
存放 在 地 址 为 00002H 的 字 节 存储 单元 中 ,高 8 位 存放 在 地 址 为 00003H 的 字 节 存储 单元 中 。 
如 果 把 地 址 00003H 作为 字 存 储 单元 的 地 址 ,那么 对 应 的 数据 是 6641H ,因为 地 址 为 00003H 
的 字 节 存储 单元 作为 低 8 位 ,地 址 为 00004H 的 字 节 存储 单元 作为 高 8 位 。 这 里 H 表示 十 六 
进 制 。 

两 个 连续 的 字 存 储 单元 构成 一 个 双 字 存储 单元 ,或 者 说 4 个 连续 的 字 节 存储 单元 构成 一 
个 双 字 存储 单元 ,其 地 址 是 较 低 的 字 存 储 单元 的 地 址 ,或 者 说 是 较 低 的 字 节 存储 单元 的 地 址 。 
一 个 32 位 的 双 字 ,存储 在 一 个 双 字 存储 单元 中 。 在 存 取 双 字 存储 单元 时 ,同样 按 “ 高 高 低 低 ” 
规则 进行 , 即 高 字 ( 高 16 位 ) 在 高 地 址 的 字 存 储 单元 中 , 低 字 ( 低 16 位 ) 在 低地 址 的 字 存 储 单 
元 中 。 

同样 地 ,8 个 连续 的 字 节 存储 单元 构成 一 个 八字 节 存 储 单元 ,其 地 址 是 较 低 的 双 字 存储 单 
元 的 地 址 ,可 以 用 于 存放 一 个 64 位 的 数据 ,也 采用 “高 高 低 低 ”规则 。 

【 例 1-7】 如 图 1. 3 所 示 ,地 址 为 00008H 的 双 字 存储 单元 中 的 数据 是 00010203H。 其 中 
低 字 ( 低 16 位 ) 在 地 址 为 00008H 的 字 存 储 单元 中 ,高 字 ( 高 16 位 ) 在 地 址 为 0000AH 的 字 存 
储 单元 中 。 类 似 地 ,地 址 为 00000H 的 双 字 存储 单元 中 的 数据 是 41353945H 。 

【 例 1-8〗 如 下 C 程序 dp13 演示 数据 存储 的 组 织 情况 : 

#include < stdio.h> 
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char buffL ]={3 21019] ; JI3F 0682 
int a b; 
int mair() 
{ 
char * p= buff; 
AN 
开阔 ( intk ) p; Mi 
b=*( intk) (pt1); [2 
AN 
printfk" ae%x, b=%An" ,a b); m3 
printfk" a%d b=%dn", a b); M4 
retum 0; 


] 

利用 VC 2010 集成 开发 环境 编译 并 运行 上 述 程序 ,可 得 到 以 下 运行 结果 : 
a 10208 b= 82000102 
a 061, b= - 211928958 

在 上 述 C 程序 dp13 中 定义 了 一 个 字符 数组 buff ,参考 图 1. 3 所 示 地 址 为 00008H 开始 的 
字 节 存储 单元 的 内 容 , 对 其 初始 化 。 换 句 话 说 ,字符 数组 buff 相当 于 从 地 址 00008H 到 
0000CH 为 止 的 5 个 字 节 存 储 单元 。 另 外 ,安排 了 一 个 字符 指针 变量 p ,其 值 被 设置 为 buff 的 
开始 地 址 。 

位 于 L1 行 的 赋值 语句 ,把 从 buff 开始 的 4 个 字 节 作为 一 个 双 字 存储 单元 ,将 其 值 传送 到 
整 型 变量 a 中 。 根 据 *“ 高 高 低 低 ”规则 ,变量 a 就 含有 数据 00010203H。 类 似 地 ,位 于 L2 行 的 
赋值 语句 ,把 从 buff 十 1 开始 的 4 个 字 节 作为 一 个 双 字 存储 单元 ,将 其 值 传送 到 整 型 变量 4。 
中 。 这 样 ,变量 5 也 就 含有 数据 82000102H。 而 L3 行 的 输出 语句 是 按 十 六 进 制 形式 输出 变 
量 a 和 2 的 值 ,所 以 就 产生 第 一 行 的 输出 结果 。L4 行 的 输出 语句 是 按 十 进 制 形式 输出 ,并 作 
为 有 符号 数 处 理 , 由 于 变量 5 中 的 最 高 位 (符号 位 ) 为 1, 因 此 为 负数 。 

注意 ,在 C 语言 中 ,一 个 数组 所 有 元 素 占用 的 存储 单元 是 连续 的 ,但 并 不 保证 多 个 连续 定 
义 的 变量 所 占用 的 存储 单元 是 连续 的 。 


习 题 


. 简要 说 明 CPU 的 基本 功能 。 

. 简要 说 明 处 理 器 、 寄 存 器 和 存储 器 这 三 者 的 关系 。 

. 简要 说 明 机 器 指令 和 汇编 格式 指令 的 关系 。 

与 机 器 语言 相 比 ,汇编 语言 有 何 特点 ? 与 高 级 语言 相 比 ,汇编 语言 有 何 特点 ? 
汇编 语言 有 何 优 缺点 ? 

. 简要 描述 源 程序 与 目标 代码 的 关系 。 

. 汇编 程序 (器 ) 的 作用 是 什么 ? 汇编 程序 (器 ) 与 编译 程序 (器 ) 有 何 异 同 ? 
. 现在 还 有 哪些 场合 需要 使 用 汇编 语言 ? 为 什么 ? 

. 简要 说 明 有 符号 整数 采用 补 码 表示 的 规律 。 

10. 举例 说 明 在 有 符号 整数 补 码 表示 时 符号 扩展 的 作用 和 规律 。 

11. 简要 说 明 数 值 数 据 和 非 数 值 数据 的 相同 点 和 不 同 点 。 


忆 oo 站 四 四 如 
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12. 在 计算 机 系统 中 ,如 何 表示 西 文字 符 和 汉字 符 ? 如 何 表示 “笑脸 "符号? 
13. 简要 说 明 十 进 制 数 字符 的 ASCII 码 的 规律 和 英文 字母 的 ASCII 码 的 规律 。 
14. 假设 采用 “高 高 低 低 ” 存 储 规则 ,请 说 明 字 节 、 字 和 双 字 之 间 的 关系 。 

15. 简要 说 明 字符 和 字符 串 的 存储 关系 ,以 及 它们 之 间 可 能 的 数值 关系 。 


16. 存储 单元 的 内 容 和 存储 单元 的 地 址 是 两 个 不 同 的 概念 ,请 举例 说 明 它们 之 间 可 能 存 
在 的 关系 。 





IA-32 处 理 器 基本 功能 


汇编 语言 与 机 器 关系 密切 ,理解 和 应 用 汇编 语言 ,必定 要 掌握 相关 处 理 器 的 基本 功能 。 本 
章 介 绍 IA-32 系列 CPU 的 基本 运行 环境 和 功能 ,包括 通用 寄存 器 、 标 志 寄 存 器 、 指 令 指针 寄存 
器 ,存储 器 分 段 管 理 、 寻 址 方式 和 堆栈 ,同时 说 明 部 分 基本 的 常用 指令 。 


2.1 IA-32 处 理 器 简介 


在 具体 介绍 处 理 器 的 基本 运行 环境 和 功能 之 前 , 先 简 单 介绍 IA-32 系列 CPU 的 发 展 历史 
和 IA-32 系列 CPU 的 工作 方式 。 


2.1.1 IA-32 系列 处 理 器 


IA-32 系列 CPU 泛 指 所 有 基于 Intel( 英 特 尔 )IA-32 架构 的 32 位 微 处 理 器 ,从 早先 的 
Intel 80386 处 理 器 ,到 Pentium( 奔 腾 ) 处 理 器 ,再 到 Xeon( 至 强 ) 处 理 器 等 。 

IA-32 系列 CPU 的 一 个 最 大 特点 是 保持 与 先前 处 理 器 的 兼容 。 在 目前 最 新 的 处 理 器 上 ， 
仍然 可 以 运行 为 那些 始 于 1978 年 的 处 理 器 所 编写 的 程序 。 在 了 解 IA-32 系列 处 理 器 基本 运 
行 环境 和 功能 的 过 程 中 ,可 以 明显 感受 到 “传承 ”。 

1. 早期 的 16 位 处 理 器 

Intel 8086/8088 是 IA-32 系列 CPU 的 前 身 。 

1978 年 Intel 公司 率先 推出 了 16 位 微 处 理 器 8086。 在 当时 Intel 8086 的 功能 足够 强 。 
它 具 有 16 位 的 寄存 器 。 具 有 16 条 外 部 数据 线 ,能 在 一 个 总 线 周 期 内 存 取 在 偶 地 址 开始 的 字 
操作 数 。 还 具有 20 条 地 址 线 ,物理 地 址 空间 范围 可 达到 1MB。 

1979 年 ,Intel 公司 推出 了 准 16 位 微 处 理 器 8088。 它 与 Intel 8086 的 差异 是 ,对 外 只 有 8 
根 数据 线 ,总 是 按 字 节 存 取 内 存单 元 。 在 当时 这 很 有 实际 意义 ,因为 当时 许多 价格 合理 的 外 部 
接口 或 设备 都 是 8 位 结构 ,这 样 就 可 以 方便 地 与 8 位 外 部 接口 或 设备 相连 。20 世纪 80 年 代 
广泛 应 用 的 IBM PC 及 其 同 档次 的 兼容 机 都 采用 Intel 8088 作为 CPU 。 

Intel 8086/8088 引入 了 存储 器 分 段 管理 的 概念 。 存 储 器 分 段 管理 延续 至 今 ,分 段 是 存储 
器 管理 的 第 一 步 。 

1982 年 Intel 公司 推出 了 一 款 “ 超 级 ”16 位 微 处 理 器 , 即 Intel 80286。 与 Intel 8086/8088 
相 比 , 它 在 速度 和 性 能 上 都 有 较 大 的 提高 。 它 具有 24 根 地 址 线 , 可 寻 址 的 最 大 物理 空间 达 
16MB。Intel 80286 引入 了 保护 方式 ,处 理 器 具有 实地 址 方式 和 保护 方式 两 种 工作 方式 。 在 
保护 方式 下 ,提供 了 初步 的 保护 机 制 。 

2. 第 一 款 32 位 处 理 器 

1985 年 Intel 公司 推出 了 32 位 微 处 理 器 80386。 它 是 IA-32 系列 CPU 中 第 一 款 32 位 处 
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理 器 。 它 不 仅 是 征 处 理 器 发 展 进程 中 的 里 程 碑 ,而 且 现 在 看 来 仍然 是 IA-32 系列 CPU 家 族 中 
担负 过 发 扬 光大 重任 的 成 员 。 从 程序 员 的 角度 看 ,IA-32 系列 CPU 始终 保持 了 Intel 80386 的 
执行 环境 。 

Intel 80386 全 面 支持 32 位 数据 类 型 和 32 位 操作 。 通 用 寄存 器 等 从 先前 的 16 位 扩展 到 
32 位 。 数 据 传送 和 算术 逻辑 运算 等 各 种 操作 从 先前 的 8 位 或 者 16 位 扩展 到 8 位 、16 位 或 者 
32 位 。 它 拥有 32 根 数 据 线 ,存储 器 存 取 操作 也 从 先前 的 1 个 或 者 2 个 连续 字 节 (16 位 ) 扩 展 
到 1 个 .2 个 或 者 4 个 连续 字 节 (32 位 )。 

Intel 80386 还 增加 了 若干 条 包括 位 操作 在 内 的 新 指令 。 这 些 新 指令 可 使 得 某 些 任务 更 
容易 实现 。 

Intel 80386 支持 实地 址 方式 和 保护 方式 两 种 工作 方式 。 在 保护 方式 下 ,可 寻 址 的 物理 地 
址 空间 高 达 4GB, 在 当时 这 个 空间 是 巨大 的 。 在 支持 存储 器 分 段 管理 的 基础 上 ,还 增加 了 可 
选 的 分 页 管理 ,为 实现 虚拟 存储 器 提供 了 有 效 的 支撑 。 在 保护 方式 下 ,提供 了 完善 的 保护 机 
制 。 所 有 这 些 功 能 ,为 实现 多 任务 管理 提供 了 硬件 基础 ,为 进入 32 位 时 代 做 好 了 准备 。 

3. 不 断 推陈出新 

1989 年 Intel 公司 推出 了 80486 微 处 理 器 。 它 是 在 Intel 80386 的 基础 上 集成 数值 协 处 理 
器 80387 和 高 速 缓 存 而 构成 的 。 它 采用 “流水 线 ” 的 方式 执行 指令 ,从 而 总 体 性 能 更 好 。 所 谓 
“流水 线 ? 方 式 是 指 , 把 指令 处 理 分 隔 成 若干 个 阶段 ,每 个 阶段 都 有 独立 的 部 件 来 处 理 , 当 一 条 
指令 的 某 个 处 理 阶段 完成 后 , 它 就 进入 到 下 一 个 处 理 阶段 ,而 独立 的 处 理 部 件 就 可 立即 处 理 下 
一 条 指令 。 

1993 年 Intel 公司 推出 了 Pentium( 奔 腾 ) 微 处 理 器 。 它 拥有 两 条 “流水 线 ”, 被 称 为 U 流 
水 线 和 V 流水 线 , 从 而 实现 超标 量 。 它 支持 的 数据 总 线 位 数 达 到 64 位 。 在 1997 年 还 推出 了 
基于 MMX 技术 的 Pentium 微 处 理 器 。MMX 指 多 媒体 扩展 (Multi Media eXtension) ,MMX 
技术 的 重点 是 单 指令 多 数据 (SIMD) 技 术 。 

1995 年 Intel 公司 推出 了 Pentium Pro( 高 能 奔腾 ) 微 处 理 器 。Pentium Pro 微 处 理 器 采用 
了 新 的 微 体系 架构 (P6)。 它 支持 的 数据 总 线 位 数 是 64 位 ; 支持 的 物理 地 址 位 数 达 到 36 位 ; 
内 部 寄存 器 仍 是 32 位 。 在 此 基础 上 ,又 陆续 推出 了 Pentium 下 微 处 理 器 和 Pentium 由 微 处 理 
器 。 其 中 , Pentium 上 还 引入 了 流 式 SIMD 的 扩展 技术 SSE。 

2000 年 ,Intel 公司 的 Pentium 4 系列 处 理 器 面世 。Pentium 4 系列 处 理 器 采用 更 新 的 微 
体系 架构 (NetBurst)。 它 还 引入 了 流 式 SIMD 的 扩展 技术 SSE2 和 SSE3。 此 后 ,基于 
Pentium 4 微 处 理 器 实现 了 64 位 体系 架构 ,实现 了 虚拟 化 技术 (VT)。 

2001 年 ,Xeon( 至 强 ) 处 理 器 系列 被 推出 。 这 些 处 理 器 是 为 构建 多 处 理 器 服务 器 系统 和 高 
性 能 工作 站 而 设计 的 。 

2003 年 ,Pentium M 处 理 器 被 推出 。 它 具有 低 功 耗 支持 移动 计算 的 特点 。 

随 着 技术 进步 和 需求 扩展 ,新 的 性 能 更 强大 和 功能 更 完备 的 处 理 器 不 断 被 推出 。 本 书 所 
介绍 的 内 容 是 32 位 程序 设计 的 基础 ,也 是 64 位 程序 设计 的 基础 。 


2.1.2 保护 方式 和 实地 址 方式 


IA-32 系列 CPU 有 3 种 工作 方式 : 保护 方式 实地 址 方式 和 系统 管理 方式 ; 还 有 一 种 子 
工作 方式 , 即 虚 拟 8086 方式 。 





第 2 章 IA-32 处 理 器 基本 功能 





1. 保护 方式 

保护 方式 (Protected Mode) 是 IA-32 系列 CPU 的 常态 工作 方式 。 只 有 在 保护 方式 下 ， 
IA-32 系列 CPU 才能 够 发 挥 出 其 全 部 性 能 和 特点 。Windows 操作 系统 和 基于 IA-32 系列 
CPU 的 Linux 操作 系统 都 是 运行 于 保护 方式 。 

在 保护 方式 下 ,全 部 32 根 地 址 线 有 效 , 可 寻 址 高 达 4GB 的 物理 地 址 空间 。 

在 保护 方式 下 ,支持 扩充 的 存储 器 分 段 管 理 机 制 和 可 选 的 存储 器 分 页 管理 机 制 。 不 仅 为 
存储 器 保护 和 共享 提供 了 硬件 支持 ,而 且 为 实现 虚拟 存储 器 提供 了 充分 的 硬件 支持 。 在 保护 
方式 下 ,用 于 指定 存储 单元 的 线性 地 址 可 以 不 是 真实 的 物理 地 址 ,而 是 面向 虚拟 存储 器 的 虚拟 
地 址 。 

在 保护 方式 下 ,提供 了 完善 的 保护 机 制 。 支 持 4 个 特权 级 ,实施 特权 检查 , 既 能 实现 资源 
共享 ,又 能 保证 代码 及 数据 的 安全 和 保密 ,还 能 保证 各 个 任务 之 间 的 隔离 。 

这 些 是 支持 多 任务 的 基础 。 在 保护 方式 下 ,可 以 支持 操作 系统 实现 多 任务 管理 。 要 支持 
多 个 任务 同时 运行 ,前 提 是 具备 完善 的 保护 机 制 。 不 仅 需要 精准 地 控制 对 存储 器 的 访问 ,而 且 
需要 有 效 地 控制 对 指令 的 执行 。 所 有 这 些 都 表现 为 一 个 词 “保护 ”, 这 应 该 就 是 保护 方式 名 称 
的 由 来 。 

在 保护 方式 下 ,还 支持 虚拟 8086 方式 (Virtual-8086 Mode)。 在 保护 方式 下 运行 的 多 个 
任务 ,可 以 有 不 同 的 运行 方式 。 虚 拟 8086 方式 是 保护 方式 下 可 选 的 任务 运行 方式 ,所 以 称 为 
子 工作 方式 。 利 用 虚拟 8086 方式 ,可 以 在 多 任务 环境 下 运行 面向 Intel 8086/8088 处 理 器 设 
计 的 程序 。 在 保护 方式 下 ,由 于 处 理 器 支持 多 任务 ,因此 可 以 同时 运行 多 个 这 样 的 程序 。 

本 章 介绍 IA-32 处 理 器 的 基本 功能 ,第 3 章 和 第 4 章 将 进一步 介绍 常用 指令 ,同时 介绍 汇 
编 语 言 程序 设计 ,第 5 章 将 结合 由 VC 2010 生成 的 目标 代码 来 展开 。 在 这 几 章 中 , 除 有 特别 
说 明 外 ,都 基于 保护 方式 。 在 第 9 章 将 详细 介绍 保护 方式 下 的 存储 器 管理 和 任务 管理 。 

2. 实地 址 方式 

实地 址 方式 (Real-address Mode) 是 最 初 的 工作 方式 。 这 里 的 “最 初 " 有 两 层 含 义 。 其 一 ， 
在 开机 或 者 重新 设置 系统 后 ,IA-32 系列 CPU 处 于 实地 址 方式 。 实 地 址 方式 是 处 理 器 重新 开 
始 运行 后 的 最 初 工作 方式 。 其 二 ,在 很 久 以 前 的 Intel 8086/8088 处 理 器 只 具有 所 谓 的 实地 址 
方式 ,没有 保护 方式 。 实 地 址 方式 是 IA-32 系列 CPU 中 最 初 的 处 理 器 的 工作 方式 。 

在 实地 址 方式 下 ,只 能 访问 最 低 端的 1MB 的 物理 地 址 空间 。 地 址 空间 的 范围 为 00000H 一 
FFFFFH。 这 与 最 初 的 Intel 8086/8088 处 理 器 只 有 20 根 地 址 线 有 关 。 

在 实地 址 方式 下 ,只 支持 存储 器 的 分 段 管理 ,而 且 每 个 存储 段 的 大 小 限于 64KB。 段 内 的 
有 效 地 址 范围 为 0000H 一 FFFFH。 实 地 址 方式 不 支持 分 页 存储 管理 机 制 。 可 以 这 样 认为 ,在 
实地 址 方式 下 ,用 于 指定 要 访问 的 存储 单元 的 线性 地 址 就 是 真实 的 物理 地 址 。 

实地 址 对 应 保护 方式 下 的 虚 地 址 。 这 应 该 是 实地 址 方式 的 名 称 由 来 。 实 地 址 方式 常常 被 
简称 为 实 方式 。 

显然 ,在 实地 址 方式 下 ,IA-32 系列 CPU 不 能 发 挥 其 全 部 性 能 。 因 此 ,实地 址 方式 现在 往 
往 只 是 初始 阶段 的 工作 方式 ,用 于 完成 进入 保护 方式 的 各 项 准备 ,之 后 就 切换 到 保护 方式 。 当 
然 ,即使 工作 在 实地 址 方式 .现在 的 1A-32 系列 CPU 性 能 也 远 强 于 早先 的 16 位 处 理 器 。 

在 实地 址 方式 下 ,处 理 器 的 基本 执行 环境 和 基本 指令 集 与 保护 方式 下 是 相同 的 ,因此 本 章 
和 随后 几 章 所 介绍 的 内 容 也 适用 于 实地 址 方式 ,特别 说 明 的 除外 。 但 是 ,相对 于 保护 方式 , 实 
地 址 方式 有 一 些 局 限 ,在 第 6 章 将 介绍 实地 址 方式 的 具体 局 限 。 
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3. 工作 方式 的 切换 

图 2. 1 给 出 了 IA-32 系列 CPU 在 保护 方式 、 实 地 址 方式 .虚拟 8086 方式 和 系统 管理 方式 
之 间 切 换 的 情况 。 在 任何 一 种 方式 下 重新 设置 或 者 开机 后 ,CPU 首先 进入 实地 址 工作 方式 。 
控制 寄存 器 CR0 中 的 保护 方式 使 能 (Protection Enable,PE) 位 是 开启 和 关闭 保护 方式 的 控制 
位 。 当 PE 位 被 设置 ,开启 保护 方式 ; 当 PE 位 被 清 零 ,关闭 保护 方式 进入 实地 址 方式 。 在 保 
护 方式 下 ,可 以 启动 以 虚拟 8086 方式 运行 的 新 任务 。 标 志 寄 存 器 EFLAGS 中 的 虚拟 机 
(Virtual Machine,VM) 位 决定 处 理 器 运行 于 保护 方式 还 是 虚拟 8086 方式 。 当 VM 位 被 设 
置 ,以 虚拟 8086 方式 运行 任务 ; 当 VM 位 被 清 零 , 则 恢复 以 保护 方式 运行 任务 。 当 处 理 器 的 
引 脚 SMI# 被 激活 ,导致 系统 管理 中 断 , 于 是 就 进入 系统 管理 方式 。 在 系统 管理 方式 下 执行 
RSM 指令 ,就 返回 到 进入 系统 管理 方式 之 前 的 工作 方式 。 


Reset (实地 址 方式 


| RSM 


PE=0 | PE=1 
SMI# 


CD 
RSM 
wo | VM=]1 
SMI# 
虚拟 8086 方 式 


RSM 


SMI# 


2.1 处 理 器 工作 方式 的 切换 


系统 管理 方式 (System Management Mode) 是 特别 的 管理 方式 , 它 给 操作 系统 提供 了 实现 
诸如 电源 管理 和 OEM 个 性 化 特色 的 机 制 。 在 系统 管理 方式 下 ,处 理 器 在 保存 当前 任务 ( 进 
程 ) 现 场 期 间 , 采 用 独立 的 地 址 空间 ,执行 系统 管理 方式 相应 的 代码 。 


2.2 通用 寄存 器 及 使 用 


在 IA-32 系列 CPU 中 ,有 包括 通用 寄存 器 、 标 志 寄 存 器 和 指令 指针 寄存 器 等 在 内 的 多 种 
寄存 器 ,程序 员 用 得 最 多 的 是 通用 寄存 器 。 本 节 首 先 介绍 通用 寄存 器 ,然后 再 介绍 简单 传送 指 
令 和 加 减 指令 。 


2.2.1 通用 寄存 器 


IA-32 系列 CPU 有 8 个 32 位 的 通用 寄存 器 (General-Purpose Registers) 。 这 些 寄存 器 的 
名 称 分 别 为 EAX、EBX、ECX、EDX、ESP、EBP、ESI 和 EDI。 在 Intel 80386 之 前 的 16 位 CPU 
中 ,只 有 8 个 16 位 的 通用 寄存 器 。 

这 些 寄 存 器 不 仅 可 以 保存 算术 逻辑 运算 过 程 中 的 操作 数 ,还 可 以 作为 指针 给 出 存储 单元 
的 地 址 ,或 者 给 出 计算 存储 单元 地 址 过 程 中 的 一 部 分 。 因 此 ,把 这 些 寄存 器 称 为 通用 寄存 器 。 

【 例 2-1】 如 下 指令 演示 通用 寄存 器 的 一 些 用 法 。 其 中 .作为 后 级 的 H 表示 十 六 进 制 ,分 
号 之 后 是 解释 。 

WW ”EAX 12345678H :ENE 12345678H 


第 2 章 IA-32 处 理 器 基本 功能 人 19 





WW ESl, 123%4H :ESI= 11223344 
AD EMX EI :ENE 235689BOH 

WwW EX EX ;EBX 235689BOH 

MV ”EX [ES ;ESI 作为 指针 给 出 存储 单元 地 址 

MY EX [EX+ 8] ;EX 作为 计算 存储 单元 地 址 的 一 部 分 


这 8 个 32 位 通用 寄存 器 的 低 16 位 相当 于 8 个 16 位 的 通用 寄存 器 ,可 以 单独 存 取 它 们 。 
如 图 2. 2 所 示 ,这 些 16 位 通用 寄存 器 的 名 称 分 别 为 AX、BX、CX、DX、BP、SI、DI 和 SP。 它们 
分 别 与 Intel 8086/8088 CPU 和 Intel 80286 CPU 的 8 个 16 位 通用 寄存 器 相对 应 ,从 而 保持 
了 与 早先 处 理 器 的 兼容 。 


31 16 15 8 7 0 16 位 。 32 位 





























AH AL AX EAX 
BH BL BX EBX 
cH cL CX ECX 
DH DL DX EDX 
BP EBP 
SI ESI 
DI EDI 
SP ESP 














图 2.2 通用 寄存 器 及 其 名 称 


【 例 2-2〗 如 下 指令 演示 这 8 个 16 位 通用 寄存 器 的 一 些 使 用 特点 ,既是 32 位 寄存 器 的 低 
16 位 ,同时 又 可 被 单独 使 用 。 


Ww EX 11112220H ;EAE 11112220H 
MW A PH :ENE 11119999H 
MXM EX EX ;DE 111199H 
MY DX 8766H ;ED 11118766H 
AD MX DX ;EAE 111120FEH 


为 了 灵活 地 处 理 16 位 数据 和 8 位 数据 ,4 个 16 位 的 通用 寄存 器 AX、BX、CX 和 DX 还 可 
分 解 成 8 个 独立 的 8 位 寄存 器 ,这 8 个 8 位 的 寄存 器 有 各 自 的 名 称 , 均 可 独立 存 取 。 如 图 2. 2 
所 示 ,AX 寄存 器 分 解 为 AH 寄存 器 和 AL 寄存 器 ; BX 寄存 器 分 解 为 BH 寄存 器 和 BL 寄存 
器 ; CX 寄存 器 分 解 为 CH 寄存 器 和 CL 寄存 器 ; DX 寄存 器 分 解 为 DH 寄存 器 和 DL 寄存 器 。 
名 称 中 的 字母 H 表示 高 ,字母 L 表示 低 。AH 寄存 器 就 是 AX 寄存 器 的 高 8 位 ,AL 寄存 器 就 
是 AX 寄存 器 的 低 8 位 ,AH 寄存 器 和 AL 寄存 器 的 合并 就 是 AX 寄存 器 。 其 他 寄存 器 以 此 


类 推 。 
【 例 2-3〗 如 下 指令 演示 这 8 个 8 位 寄存 器 的 一 些 使 用 特点 。 
Ww ER 11112220H :Be 11112220H 
WW BL7H :BE 1111772 
WW Bm :BE 1111779H 
AD B28 :BE 1111771BH 


注意 ,另外 4 个 16 位 的 通用 寄存 器 SP、BP、SI 和 DI 不 能 分 解 为 8 位 寄存 器 。 
这 些 通 用 寄存 器 除了 上 述 的 通用 功能 外 ,还 各 自 有 一 些 特殊 的 专门 用 途 , 它 们 各 自 的 命名 
与 其 专门 用 途 有 关 。 这 些 寄 存 器 的 专门 用 途 和 命名 源 于 早先 的 16 位 CPU 8086。AX 和 AL 
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寄存 器 又 被 称 为 累加 器 (Accumulator) 。BX 寄存 器 被 称 为 基 (Base) 地 址 寄存 器 ,可 作为 存储 
器 指针 使 用 。CX 寄存 器 被 称 为 计数 (Counter) 寄 存 器 ,在 字符 串 操 作 和 循环 操作 时 ,用 它 来 
控制 重复 循环 操作 次 数 , 在 移 位 操作 时 ,CL 寄存 器 用 于 保存 移 位 的 位 数 。DX 寄存 器 称 为 数 
据 (Data) 寄 存 器 。SI 和 DI 寄存 器 称 为 变 址 寄存 器 ,在 字符 串 操作 中 ,规定 由 SI 给 出 源 指针 ， 
由 DI 给 出 目的 指针 ,所 以 SI 也 称 为 源 变 址 (Source Index) 寄 存 器 ,DI 也 称 为 目的 变 址 
(Destination Index) 寄 存 器 ,SI 和 DI 也 可 作为 一 般 存储 器 指针 使 用 。BP 和 SP 寄存 器 称 为 指 
针 寄 存 器 ,BP 也 称 为 基 指 针 (Base Pointer) 寄 存 器 ,SP 只 作为 堆栈 指针 (Stack Pointer) 使 用 。 
Intel 80386 作为 32 位 的 CPU ,内 部 的 通用 寄存 器 扩展 到 32 位 ,在 给 这 些 寄存 器 命名 时 ,在 原 
先 的 名 称 前 加 了 一 个 字母 下 ,表示 扩展 。 随 后 的 IA-32 系列 CPU 的 32 位 寄存 器 延续 这 样 的 
命名 。 


2.2.2 简单 传送 指令 

数据 传送 指令 组 包括 普通 传送 指令 ,交换 指令 、 堆 栈 操 作 指 令 .条 件 传送 指令 等 。 目 标 程 
序 中 用 得 最 多 的 指令 是 数据 传送 指令 。 利 用 数据 传送 指令 能 够 给 通用 寄存 器 和 存储 单元 赋 初 
值 ,能 够 实现 在 通用 寄存 器 和 存储 单元 之 间 传 送 数 据 。 

1. 传送 指令 (MOV) 

传送 (Move) 指 令 是 使 用 得 最 频繁 的 指令 ,其 格式 如 下 : 

WW OBET Sm 
此 指令 把 源 操作 数 SRC 送 至 目的 操作 数 DEST, 即 : 
DEST = SRC 

传送 操作 并 不 改变 源 操作 数 。 

源 操作 数 SRC 可 以 是 通用 寄存 器 、 存 储 单元 或 立即 数 , 而 目的 操作 数 DEST 可 以 是 通用 
寄存 器 或 存储 单元 。 两 个 操作 数 的 尺寸 必须 一 致 ,可 以 是 一 个 字 节 (8 位 )、 字 (16 位 ) 或 者 双 字 
(32 位 )。 在 Intel 80386 之 前 的 CPU 最 多 允许 16 位 操作 数 。 

【 例 2-4】 如 下 指令 演示 把 立即 数 传送 到 通用 寄存 器 ,从 而 给 对 应 寄存 器 赋 初 值 , 分 号 之 
后 是 解释 ,作为 后 级 的 H 表示 十 六 进 制 。 


WW EX 658 ;ECX= 00010002H, 了 2 位 初 值 
WY DI, 65% :DI= FFFEH, 16 位 初 值 
MV DL.8 :0= 08H,8 位 初 值 


注意 ,立即 数 永 远 不 能 作为 目的 操作 数 。 
【 例 2-5〗 如 下 指令 演示 在 通用 寄存 器 之 间 传 送 数 据 ,分 号 之 后 是 解释 。 


MOV EX EX :把 国 复 制 到 EX 
MW DX oI ;把 D1 复制 到 以 
MW A 人 HE ;把 已 复制 到 败 
【 例 2-6】 如 下 指令 片段 ,实现 把 寄存 器 EAX 与 寄存 器 EBX 的 内 容 交 换 。 
MW EX EAX ;EX 相当 于 是 一 个 临时 变量 
WwW EX EX 


Ww EEX 
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【 例 2-7】 如 下 指令 演示 在 通用 寄存 器 和 存储 单元 之 间 传 送 数据 ,分 号 之 后 是 解释 。 


WW  Q [ES ;把 由 BI 指定 的 字 节 存储 单元 的 内 容 送 到 QL 
MV Ex [EX ;把 由 轧 指 定 的 双 字 存储 单元 的 内 容 送 到 EX 
MV [wD], ;把 以 的 内 容 送 到 印 ! 指定 的 字 存 储 单元 


除了 将 在 4. 1 节 介 绍 的 字符 串 操作 指令 外 ,指令 的 源 操作 数 和 目的 操作 数 不 能 同时 是 存 
储 单元 。 如 果 要 在 两 个 存储 单元 间 传 送 数据 ,那么 可 利用 通用 寄存 器 过 渡 的 方法 。 
【 例 2-8〗 如 下 指令 演示 把 由 ESI 所 指 的 字 节 存储 单元 的 内 容 , 传 送 到 由 EBX 所 指 的 字 


节 存 储 单元 。 
MV AL [ES ;这 样 会 冲 掉 人 L 原 有 内 容 
WW [EX ,人 
可 采用 各 种 存储 器 寻 址 方式 来 指定 存储 单元 ,这 将 在 2. 5 节 中 介绍 。 
2. 交换 指令 (XCHG) 


利用 交换 (Exchange) 指 令 可 方便 地 实现 通用 寄存 器 与 通用 寄存 器 或 存储 单元 之 间 的 数 

据 交换 ,交换 指令 的 格式 如 下 : 
XH Di, 0TD2 

此 指令 把 操作 数 OPRD1 的 内 容 与 操作 数 OPRD2 的 内 容 交 换 。 

OPRD1 和 OPRD2 可 以 是 通用 寄存 器 或 存储 单元 。 但 不 能 同时 是 存储 单元 ,也 不 能 有 立 
即 数 。 两 个 操作 数 的 尺寸 必须 一 致 ,可 以 是 一 个 字 节 (8 位 )、 字 (16 位 ) 或 者 双 字 (32 位 )。 在 
Intel 80386 之 前 的 CPU 最 多 允许 16 位 操作 数 。 

【 例 2-9】 如 下 指令 演示 在 通用 寄存 器 之 间 交 换 数据 。 


Xe AL 用 
Xe Sl, EX 
x EX EX ;实现 例 26 的 功能 ,更 加 简单 

【 例 2-10】 如 下 指令 演示 在 通用 寄存 器 和 存储 单元 之 间 交 换 数据 。 
Xe AL [EBM 冯 与 由 也 指定 的 字 节 存储 单元 交换 
XOHG [ESD, BX 以 与 由 BI 指定 的 字 存 储 单元 交换 
XHG EX [ED ;EX 与 由 印 | 指定 的 双 字 存储 单元 交换 


2.2.3 简单 加 减 指令 


IA-32 系列 CPU 提供 加 、 减 、 乘 和 除 4 种 基本 算术 运算 操作 指令 。 这 里 先 介绍 简单 的 加 、 
减 运算 指令 。 
1. 加 法 指令 (ADD) 
加 法 (Add) 指 令 的 格式 如 下 : 
AD LOBT Sm 
这 条 指令 完成 两 个 操作 数 相 加 ,结果 送 至 目的 操作 数 DEST, 即 : 
DEST < DEST+ SRC 
源 操 作 数 SRC 可 以 是 通用 寄存 器 、 存 储 单元 或 立即 数 , 而 目的 操作 数 DEST 可 以 是 通用 
寄存 器 或 存储 单元 。 两 个 操作 数 的 尺寸 必须 一 致 ,可 以 是 一 个 字 节 (8 位 )、 字 (16 位 ) 或 者 双 字 
(32 位 ) 。 在 Intel 80386 之 前 的 CPU 最 多 允许 16 位 操作 数 。 
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【 例 2-11〗 如 下 指令 演示 加 法 指令 ADD 的 使 用 .分 号 之 后 是 解释 。 


AD EX 20 :使 EX 加 上 20 

ADD EX EX ;使 EX 加 上 EX 值 

AD sl,10 ;使 S 加 上 10 

AD DO :使 HH 加 上 DL 值 

AD AL5 :使 印加 上 5 

AD EX [EM ;使 EX 加 上 巾 眠 指 定 的 存储 单元 的 值 


加 法 指令 ADD 会 影响 标志 寄存 器 中 的 有 关 状 态 标 志 。 在 2. 3 节 将 介绍 状态 标志 。 
2. 减法 指令 (SUB) 
减法 (Subtract) 指 令 的 格式 如 下 : 
SB L557 Sm 
这 条 指令 完成 两 个 操作 数 相 减 ,结果 送 至 目的 操作 数 DEST, 即 : 
DEST <= DEST- SRC 
源 操 作 数 SRC 可 以 是 通用 寄存 器 、 存 储 单元 或 立即 数 ,而 目的 操作 数 DEST 可 以 是 通用 
寄存 器 或 存储 单元 。 两 个 操作 数 的 尺寸 必须 一 致 ,可 以 是 一 个 字 节 (8 位 )、 字 (16 位 ) 或 者 双 字 
(32 位 )。 在 Intel 80386 之 前 的 CPU 最 多 允许 16 位 操作 数 。 
【 例 2-12】 如 下 指令 演示 减法 指令 SUB 的 使 用 ,分 号 之 后 是 解释 。 


SB EX 1000 ;使 EX 减 去 1000 

SB ESl, EX ;使 BI 减 去 国人 值 

SB Dl,7% ;使 D1 减 去 D 

SB MO ;使 听 减 去 QL 值 

SB AL7 ;使 儿 减 去 7 

SB EX [BDI ;使 EX 减 去 由 印 | 指 定 的 存储 单元 值 


减法 指令 会 影响 标志 寄存 器 中 的 有 关 状 态 标 志 。 

3. 加 1 指令 (INC) 

很 多 情况 下 ,只 需要 加 1 ,为 此 IA-32 系列 CPU 提供 加 1 指令 。 

加 1(INCrement by 1) 指 令 的 格式 如 下 : 
IN OBEXT 

这 条 指令 完成 对 操作 数 DEST 加 1, 然 后 把 结果 送 回 DEST, 即 : 
DEST 一 DEST+ 1 

操作 数 DEST 可 以 是 通用 寄存 器 ,也 可 以 是 存储 单元 。 

【 例 2-13】 如 下 指令 演示 加 1 指令 INC 的 使 用 。 


IN EsI ;使 寄存 器 BI1 值 加 1 
IN ol ;使 寄存 器 D1 值 加 1 
IN QQ ;使 寄存 器 QL 值 加 1 


这 条 指令 不 影响 标志 寄存 器 中 的 进位 标志 ,但 会 影响 其 他 状态 标志 。 
4. 减 1 指令 (DEC) 

许多 情况 下 ,也 只 需 减 1, 为 此 IA-32 系列 CPU 提供 减 1 指令 。 

减 1(DECrement by 1) 指 令 的 格式 如 下 : 
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Ei OBET 
这 条 指令 完成 对 操作 数 DEST 减 1, 然 后 把 结果 送 回 DEST, 即 : 
DEST 一 DEST- 1 
操作 数 DEST 可 以 是 通用 寄存 器 ,也 可 以 是 存储 单元 。 
【 例 2-14】 如 下 指令 演示 减 1 指令 DEC 的 使 用 。 
DEC BI ;使 寄存 器 印 ! 值 减 1 
DEC & ;使 寄存 器 以 值 减 1 
这 条 指令 不 影响 标志 寄存 器 中 的 进位 标志 ,但 会 影响 其 他 状态 标志 。 
5. 取 补 指令 (NEG) 
取 补 指令 或 取 负 数 指令 (NEGate) 的 格式 如 下 : 


oD 
这 条 指令 对 操作 数 取 补 ,就 是 用 零 减 去 操作 数 OPRD, 再 把 结果 送 回 OPRD, 即 : 
CPD 一 0- OPRD 


这 条 指令 就 是 取得 操作 数 的 负数 。 操 作 数 是 以 补 码 表示 的 。 

操作 数 可 以 是 通用 寄存 器 ,也 可 以 是 存储 单元 。 

【 例 2-15】 如 下 指令 演示 取 负 数 指令 NEG 的 使 用 ,分 号 之 后 是 解释 ,后 级 H 表示 十 六 
进 制 。 
AL 3 A=0H 
A A=FH( -3) 
EX -5 ;EAE FFFFFFFEH 
EDX ;EAX 00000005H 

该 指令 会 影响 标志 寄存 器 中 的 有 关 状 态 标 志 。 如 果 操 作 数 为 0, 那么 使 得 进位 标志 为 0， 

否则 进位 标志 为 1 。 


2.2.4 VC 嵌入 汇编 和 实验 


在 微软 Visual Studio 2010 的 VC 集成 开发 环境 中 ,支持 嵌入 汇编 。 嵌 入 汇编 也 被 称 为 内 
嵌 汇 编 或 内 联 汇编 。 通 过 组 入 汇编 ,程序 员 可 以 实现 一 些 用 C 语言 (或 C++ 语言 ) 无 法 实现 的 
特定 操作 ,在 编写 操作 系统 内 核 代码 或 者 驱动 程序 时 ,可 能 会 有 这 样 的 需要 。 
为 了 便于 演示 和 实验 ,可 以 依托 VC 集成 开发 环境 ,采用 嵌入 汇编 的 方式 ,编写 和 演示 部 
分 汇编 语言 程序 。 
【 例 2-16】 以 下 C 程序 dp21 演示 嵌入 汇编 的 使 用 ,同时 演示 寄存 器 EAX、AX 和 AL 之 
间 的 关系 。 
#include < stdio.h> / 锭 示 程 序 2 
int mair() 
int varc (x11223344, vary 0; 
1/ 嵌入 汇编 
_asn{ 
MW EM varx // 把 变量 varx 的 值 送 到 寄存 器 EX 
MV AX 556H // 把 十 六 进 制 值 56H 送 到 寄存 器 以 





MV A,7H // 把 十 六 进 制 值 7TH 送 到 寄存 器 人 L 
MOV vary, EAX /把 寄存 器 虹 的 值 送 到 变量 vary 
} 
printf (" vary=% OB4N\n" ,vary) ; /显示 为 vary 11225571H 
return 0; 


] 

在 上 述 C 程序 中 ,由 关键 字 _asm 引导 的 一 对 花 括 号 { } 括 起 的 部 分 就 是 VC 的 嵌入 汇编 。 
其 中 ,每 一 条 指令 应 该 是 汇编 格式 指令 。 

上 述 嵌 入 汇编 代码 ,首先 把 变量 varx 对 应 存储 单元 的 值 11223344H 取 到 寄存 器 EAX 
中 ; 然后 把 十 六 进 制 值 5566H 送 到 寄存 器 AX 中 ,此 操作 更 新 AX 的 值 ( 覆 盖 原 先 的 值 
3344H); 接着 又 把 十 六 进 制 值 77H 送 到 寄存 器 AL 中 ,此 操作 更 新 AL 的 值 (覆盖 原先 的 值 
66H); 最 后 把 寄存 器 EAX 的 值 送 到 变量 vary 对 应 的 存储 单元 中 。 

从 上 述 嵌 入 汇编 代码 可 知 , 这 些 汇编 格式 的 指令 直接 存 取 了 C 语言 程序 中 定义 的 变量 。 
通过 这 样 的 安排 ,还 可 以 利用 C 语言 的 库 函 数 来 进行 输入 和 输出 。 为 了 演示 说 明 IA-32 系列 
CPU 的 指令 ,同时 实例 讲解 汇编 语言 程序 设计 ,在 随后 的 章节 中 ,许多 示例 将 采用 嵌入 汇编 的 
方式 。 如 无 特别 说 明 ,相关 示例 的 C 程序 都 是 基于 微软 Visual Studio 2010 的 VC 集成 开发 环 
境 的 控制 台 程序 。 建 议 读者 参考 相关 示例 ,通过 上 机 实验 等 方法 ,加 深 对 指令 及 其 功能 的 认识 
和 理解 。 

【 例 2-17】 以 下 C 程 序 dp22 演示 嵌入 汇编 的 使 用 ,同时 演示 32 位 、16 位 和 8 位 的 加 减 
运算 操作 。 


#include < stdioh> /演示 程序 中 2 
int mair() 
{ 
int varl, var2 var3; /定义 3 个 变量 
1/ 嵌入 汇编 
asm{ 
MOV EDX 11119950H 
INC EX 
MV var1，BDX /把 寄存 器 E 的 值 保存 到 变量 var1 中 
MV CX 8765 
pi & 
AD DC 
MV var2 EX /把 寄存 器 E 的 值 保存 到 变量 var2 中 
SB D7 
MV var3 EX // 把 寄存 器 BX 的 值 保存 到 变量 var3 中 
} 
printf (” EDX{= % O84Nn" ,varD) ; /显示 为 EXF 11119951H 
printf (" EDX2= % (84N\ n" ,var2) ; /显示 为 印信 111120B5H 
printf (”EDX3=% (84N\ n™ ,var3) ; /显示 为 EX3=- 1111209FH 
return 0; 


} 

上 述 嵌入 汇编 _asm { ”} 的 程序 片段 作为 示例 ,先后 三 次 把 寄存 器 EDX 的 值 送 到 3 个 变 
量 中 。 然 后 通过 调用 printf 函数 显示 输出 这 3 个 变量 的 值 。 这 样 通过 观察 程序 运行 的 结果 ， 
就 可 以 知道 寄存 器 EDX 在 不 同 阶段 所 含 的 内 容 。 为 了 清楚 地 反映 各 位 情况 ,因此 采用 十 六 进 
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制 的 形式 表示 寄存 器 的 内 容 。 

从 本 例 可 知 ,虽然 DX 寄存 器 是 EDX 寄存 器 的 低 端 16 位 ,但 当 DX 寄存 器 独立 作为 操作 
数 时 ,对 EDX 的 高 16 位 没有 影响 ; 同样 地 ,虽然 DL 寄存 器 是 DX 寄存 器 的 低 端 8 位 ,但 当 
DL 寄存 器 独立 参与 运算 时 ,对 DX 的 高 8 位 没有 影响 。 这 一 规则 也 适用 其 他 寄存 器 。 

【 例 2-18〗 设 变 量 varx 和 vary 代表 两 个 双 字 (32 位 ) 存 储 单元 ,分 别 存放 一 个 整数 ,编写 
一 个 求 表达 式 varx 十 vary 值 的 汇编 语言 程序 片段 。 

采用 C 语言 编写 的 演示 程序 dp23 如 下 : 

#include < stdio.h> 

int mair() 

{ 

int varx, vary; /定义 变量 


int varz; 


printk” irput:varx, vary: ") ; 


scanf" %d%d" , &arx, &ary) ; /输入 

Varz= varxt vary; WNW 计算 表达 式 
printf” var % dn" , varz) ; /输出 

retum 0; 


} 
从 上 面 的 C 语言 程序 可 知 ,计算 表达 式 varx 十 vary 的 值 ,只 有 一 条 语句 。 为 了 用 汇编 语 
言 来 实现 计算 这 个 表达 式 的 值 , 采 用 嵌入 汇编 的 方式 ,演示 程序 dp24 如 下 : 
#include < stdioh> 
int mair() 
{ 
int varx, vary; /定义 变量 
int varz; 


printf”irput:varx vary:") ; 


scanf" %d%d” ,8&varx &vary) ; /输入 

// 典 入 汇编 

_asn{ 
MY EX varx ;把 存储 单元 varx 的 值 送 到 寄存 器 EX 
AD EX vary ;把 存储 单元 vary 的 值 加 上 EX 的 值 送 到 EX 
MY varz, DX ;把 蝶 的 值 送 到 存储 单元 varz 中 

} 

printfk" varz=%d\n" , vary ; /输出 

retun 0; 


1 

实际 上 ,由 嵌入 汇编 _asm { ”} 的 程序 片段 ,代替 了 计算 表达 式 的 语句 。 按 本 例 的 要 求 , 核 
心 内 容 就 是 这 一 采用 嵌入 汇编 的 程序 片段 。 在 由 嵌入 汇编 _asm { ”} 的 程序 片段 中 ,分 号 之 后 
的 内 容 是 注释 。 





2.3 标志 寄存 器 及 使 用 


通常 CPU 含有 标志 寄存 器 ,标志 寄存 器 中 的 标志 位 能 够 反映 CPU 运算 处 理 后 的 某 些 状 
。 部 分 指令 的 执行 会 改变 某 些 标志 位 ; 部 分 指令 的 执行 依据 某 些 标志 位 。 本 节 首 先 介绍 标 
志 寄 存 器 及 其 状态 标志 ,然后 再 结 合 带 进位 加 减 指令 简单 介绍 其 作用 。 


2.3.1 标志 寄存 器 


IA-32 系列 CPU 有 一 个 32 位 的 标志 寄存 器 (EFLAGS Register)。 这 个 标志 寄存 器 含有 
一 组 状态 标志 ,一 组 系统 标志 和 一 个 控制 标志 。 图 2. 3 给 出 了 这 些 标志 在 标志 寄存 器 中 的 位 
置 。 其 中 , 标 两 个 字母 的 位 是 状态 标志 位 , 标 着 字母 X 的 位 是 系统 标志 位 , 标 着 字母 C 的 位 是 
控制 标志 位 , 带 阴 影 的 位 是 不 使 用 的 保留 位 。 
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在 Intel 80386 之 前 的 16 位 CPU 中 ,标志 寄存 器 是 16 位 的 。 随 着 IA-32 系列 CPU 的 更 
新 升级 ,不 断 增加 系统 标志 位 。 虽 然 如 此 ,但 是 早先 出 现 的 各 个 标志 的 功能 和 位 置 始 终 是 一 致 
的 ,这 样 保持 了 与 早先 处 理 器 的 兼容 。 

有 些 指 令 的 执行 会 影响 部 分 标志 ,而 有 些 指 令 的 执行 不 会 影响 标志 ; 另 一 方面 ,有 些 指令 
的 执行 受 某 些 标 志 的 影响 ,有 些 指令 的 执行 不 受 标志 的 影响 。 所 以 ,程序 员 要 充分 注意 指令 与 
标志 的 关系 。 

控制 标志 主要 是 控制 串 操作 指令 的 操作 方向 ,常用 DF 表示 ,将 在 第 4 章 中 介绍 。 系 统 标 
志 往 往 用 于 控制 操作 系统 的 运行 ,将 在 第 9 章 中 介绍 。 


2.3.2 状态 标志 


从 最 早 的 Intel 8086 CPU 开始 ,就 有 6 个 状态 标志 。 这 6 个 状态 标志 分 别 是 进位 标志 
CF 、 零 标志 ZF 符号 标志 SF ,溢出 标志 OF .奇偶 标志 PF 和 辅助 进位 标志 AF。 这 些 状 态 标 志 
主要 反映 在 执行 诸如 ADD 和 SUB 等 算术 运算 指令 后 所 得 运算 结果 的 某 些 特征 。 

1. 进位 标志 (CF) 

进位 标志 (Carry Flag,CF) 主 要 反映 算术 运算 是 否 产 生 进 位 或 借 位 。 如 果 运 算 结 果 的 最 
高 位 产生 一 个 进位 或 借 位 , 则 CF 被 置 1, 否 则 CF 被 清 0。 如 图 1. 2 所 示 , 数 据 位 的 编号 从 0 
开始 , 字 节 运算 时 的 最 高 位 是 第 7 位 , 字 运 算 时 的 最 高 位 是 第 15 位 , 双 字 运算 时 的 最 高 位 是 第 
31 位 。 

【 例 2-19】 如 下 指令 片段 演示 进位 标志 CF 的 变化 。 其 中 ,作为 后 缀 的 H 表示 十 六 进 
制 ,分 号 之 后 是 解释 。 


MW ”EAX 1245678H ;EAE 12345678H, GF 不 改变 
AD EM 677289H :ENE 7BABDF1H, CE= 0 
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ADD ”EAX 91004433H ;EAE OAC2344 CF= 1 

AD 从 42H :AE 6 CF= 0, EME OPACEBEH 
SB 儿 用 A= FH, OF 1, ENE OAQ4FHH 

SB A 8H A= BH, = 0, EAE PACEBTEH 


在 比较 无 符号 数 的 大 小 时 .要 使 用 到 进位 标志 CF。 在 进行 多 字 节 数 的 加 减 运算 时 ,也 要 
使 用 到 进位 标志 CF。 移 位 指令 也 能 够 把 操作 数 的 最 高 位 或 最 低位 移入 CF , 移 位 指令 和 进位 
标志 CF 的 配合 ,可 实现 操作 数 之 间 的 位 传送 。 

2. 零 标 志 (ZF) 

零 标 志 (Zero Flag,ZF) 反 映 运 算 结 果 是 否 为 0。 如 果 运 算 结 果 为 0, 则 ZF 被 置 1, 否 则 ZF 
被 清 0。 

【 例 2-20】 如 下 指令 片段 演示 零 标 志 ZF 的 变化 。 


SB EM EX ;EAE 00000000H, = 1 
SB A OH ;EAX= O000FFEBH, 让 0 
AD A ;EAE O000FFON, = 1 


无 论 有 符号 数 还 是 无 符号 数 , 在 判断 运算 结果 是 否 为 0 时 ,都 会 使 用 到 该 标志 。 

3. 符号 标志 (SF) 

符号 标志 (Sign Flag,SF) 反 映 运算 结果 的 符号 位 。SF 与 运算 结果 的 最 高 位 相同 ,如 果 运 
算 结果 的 最 高 位 为 1, 则 SF 被 置 1 ,和 否则 SF 被 清 0。 由 于 在 IA-32 系列 CPU 中 ,有 符号 数 采 
用 补 码 的 形式 表示 ,因此 SF 反映 了 运算 结果 的 符号 。 如 果 和 运算 结果 为 正 , 则 SF 被 清 0, 和 否则 
SF 被 置 1。 

【 例 2-21〗 如 下 指令 片段 演示 符号 标志 SF 的 变化 。 


MY EX 0000455H ;ECE 00004455H, SF 不 变化 
AD Qo ;ECF 00004p9H, S= 1 
AD & 1234 ;EGE 00005DH, S= 0 


4. 洲 出 标志 (OF) 

溢出 标志 (Overflow Flag,OF) 反 映 有 符号 数 加 减 运算 是 否 引 起 溢出 。 如 运算 结果 超出 了 
8 位 、16 位 或 32 位 有 符号 数 的 表示 范围 , 即 在 字 节 运算 时 大 于 127 或 小 于 一 128, 在 字 运 算 时 
大 于 32 767 或 小 于 一 32 768, 在 双 字 运算 时 大 于 2 147 483 647 或 小 于 一 2 147 483 648 , 称 为 溢 
出 。 如 果 溢 出 , 则 OF 被 置 1 ,否则 OF 被 清 0。 

作为 有 符号 数 ,如果 正 数 加 上 正 数 变 成 负数 ,或 者 如 果 负 数 加 上 负数 变 成 正 数 ,那么 实际 
上 已 发 生 溢出 。 类 似 地 ,作为 有 符号 数 , 如 果 正 数 减 去 负数 变 成 负数 ,或 者 如 果 负 数 减 去 正 数 
变 成 正 数 ,那么 实际 上 已 发 生 溢出 。 

【 例 2-22】 如 下 指令 片段 演示 溢出 标志 OF 和 符号 标志 SF 的 变化 ,注释 是 执行 指令 后 的 
结果 。 


MY D6 ;DL= 4H,S 和 OF 不 变化 

MW CQ. :0=24, SS 和 OF 不 变化 

AD DO :DL= 6 =0,0=0 

AD DO :0= B 相当 于 -119) ,S=1, OF=1 
SB DL6 ;DL= 8H 相当 于 - 15) ,S= 1,OF=0 
SB DL7 := TH 相当 于 124) ,S= 0 OF=1 


为 了 便于 说 明 , 采 用 8 位 数据 ,8 位 有 符号 数 的 范围 为 一 128 一 十 127。 在 执行 "ADD 
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DL,CL” 指 令 后 ,DL 的 最 高 位 是 0, 所 以 SF 为 0; 结果 为 101, 没 有 大 于 127, 没 有 发 生 溢出 ,所 
以 OF 为 0。 在 继续 执行 “ADD DL,CL” 指 令 后 ,DL 的 最 高 位 已 为 1, 所 以 SF 为 1; 结果 
(101 加 36) 大 于 127, 发 生 溢出 ,所 以 OF 为 1, 若 把 结果 视 作 有 符号 数 ,就 变 成 一 119。 继 续 执 
行 指令 “SUB DL,6”,DL 的 最 高 位 仍 为 1, 所 以 SF 为 1; 结果 为 一 125( 一 119 减 6) 不 小 于 
一 128, 没 有 发 生 溢出 ,所 以 OF 为 0。 接 着 执行 指令 “SUB DL,7”,DL 的 最 高 位 变 为 0, 所 以 
SF 为 0; 结果 (一 125 减 7) 小 于 一 128, 发 生 溢出 ,所 以 OF 为 1, 结 果 就 变 成 124。 

在 判断 有 符号 数 的 大 小 时 ,会 使 用 到 溢出 标志 OF 和 符号 标志 SF。 在 判断 无 符号 数 大 小 
时 , 则 使 用 进位 标志 CF。 溢 出 标志 OF 与 进位 标志 CF 是 两 个 不 同 的 标志 ,不 能 混淆 。 

5. 奇偶 标志 (PF) 

奇偶 标志 (Parity Flag,PF) 反 映 运 算 结 果 的 最 低 字 节 中 含有 “1” 的 位 数 是 偶数 还 是 奇数 。 
如 果 “1” 的 位 数 是 偶数 , 则 PF 被 置 1, 和 否则 PF 被 清 0。 利 用 PF 可 以 进行 奇偶 校 验 检查 ,或 产 
生 奇 偶 校 验 位 。 在 串 行 通信 中 ,为 了 提高 传送 的 可 靠 性 , 常 采 用 奇偶 校 验 。 

6. 辅助 进位 标志 (AF) 

辅助 进位 标志 (Auxitiary Carry Flag, AF) 反 映 算术 运算 中 第 3 位 是 否 产 生 进 位 或 借 位 ， 
或 者 最 低 的 4 位 是 否 有 进位 或 借 位 。 如 果 产 生 进位 或 借 位 , 则 AF 被 置 1, 和 否则 AF 被 清 0。 该 
标志 位 主要 用 于 二 进 制 编码 的 十 进 制 数 (BCD) 的 运算 中 ,十 进 制 算术 运算 调整 指令 会 自动 根 


据 该 标志 产生 相应 的 调整 动作 。 
【 例 2-23】〗 如 下 指令 片段 演示 PF 和 AF 的 变化 。 
WW EAX 6 ;EAX= 00000004H, FF 和 笑 无 变化 
AD EX 5 ;EAX= 0000000BH, FF= 0,AE= 0 
AD EAX 7 :EME 00000012H, FF= 1, A= 1 
ADD ”EAX 10000008H ;EAE 100000IAH, PF= 0, AF= 0 
AD EX 9 :EA 10000023, FF= 0, FF=1 


在 2.2.2 节 中 介绍 的 MOV 指令 和 XCHG 指令 不 影响 各 标志 ; 在 2. 2. 3 节 中 介绍 的 
ADD 指令 和 SUB 指令 根据 运算 结果 影响 这 6 个 状态 标志 ,但 INC 指令 和 DEC 指令 不 影响 进 
位 标志 CF ,而 影响 其 他 5 个 状态 标志 。 针 对 上 述 例 2-19 一 例 2-23, 请 读者 自行 考察 其 他 状态 
标志 位 的 变化 情况 。 


2.3.3 状态 标志 操作 指令 

有 时 程序 员 需 要 获取 或 设置 标志 寄存 器 中 的 状态 标志 ,从 Intel 8086 CPU 开始 就 有 专门 
的 操作 指令 。 

1. 进位 标志 操作 指令 

在 前 述 的 6 个 状态 标志 中 ,进位 标志 CF 的 用 途 最 为 广泛 。CPU 具有 单独 调整 CF 的 


(1) 清 进位 标志 指令 (CLC)。 清 进位 标志 (CLear Carry Flag) 指 令 的 格式 如 下 : 
ac 


这 条 指令 使 进位 标志 CF 为 0。 
(2) 置 进位 标志 指令 (STC) 。 置 进位 标志 (SeT Carry Flag) 指 令 的 格式 如 下 : 


SIC 
这 条 指令 使 进位 标志 CF 为 1 。 
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(3) 进位 标志 取 反 指令 CMC。 进 位 标志 取 反 (CoMplement Carry Flag) 指令 的 格式 
如 下 : 
or 
这 条 指令 使 进位 标志 CF 取 反 。 如 CF 为 1, 则 使 CF 为 0; 如 CF 为 0, 则 CF 为 1。 
上 述 三 条 进位 标志 操作 指令 仅 影响 CF, 对 其 他 标志 没有 影响 。 
【 例 2-24】 如 下 指令 片段 是 相关 指令 的 使 用 ,注释 是 执行 指令 后 相关 寄存 器 和 CF 的 


结果 。 
WW A,89H IAE HH 
AD A,M JIA 82IH (= 1 
ac 0 
STC G1 
Oo 0 


2. 获取 状态 标志 操作 指令 (LAHF) 
获取 状态 标志 操作 (Load Status Flags into AH Register) 指 令 的 格式 如 下 : 
UHF 


这 条 指令 把 标志 寄存 器 的 低 8 位 , 送 到 通用 寄存 器 AH 中 。 对 标志 位 自身 不 产生 影响 。 
利用 这 条 指令 ,可 以 把 位 于 标志 寄存 器 低 端的 5 个 状态 标志 位 信息 同时 送 到 寄存 器 AH 中 的 
对 应 位 。 

3. 设置 状态 标志 操作 指令 (SAHF) 

设置 状态 标志 操作 (Store AH into Flags) 指 令 的 格式 如 下 : 

SAF 


这 条 指令 对 标志 寄存 器 中 低 8 位 的 状态 标志 产生 影响 ,使 得 状态 标志 SF、ZF、AF、PF 和 
CF 分 别 成 为 来 自 寄存 器 AH 中 对 应 位 的 值 , 但 保留 位 (位 1\ 位 3 和 位 5) 不 受 影响 。 

【 例 2-25】 如 下 C 程序 dp25 中 的 嵌入 汇编 代码 片段 ,演示 状态 标志 操作 指令 的 使 用 , 同 
时 演示 如 何 获取 主要 的 状态 标志 ,其 中 作为 后 绥 的 H 表示 十 六 进 制 。 

#include < stdioh> 

int mair() 

{ 

ED char flag1, flag2 flag3; /定义 3 个 无 符号 字 节 变量 


/ 锐 入 汇编 
_asn{ 
MV MoO 
SNF //SF=0, T=0, FF=0,AF=0,0=0 
IAF // 把 标志 寄存 器 低 8 位 ( OH) 又 回 送 到 州 
MV flagl, MH /把 出 的 值 保存 到 变量 flagl 
MV DX 75%H /DE THH 
AD DL DH /ME TI A=1, =1 
LAF /把 标志 寄存 器 低 8 位 ( 131) 送 到 用 寄存 器 
MV ”flag2 MH /把 用 的 值 保存 到 变量 flag 
SB m8 /ME FI S=1, 0=1 
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ac ME=0 
LAF /把 标志 寄存 器 低 8 位 ( 8H) 送 到 州 
MV flag3 MH /把 出 的 值 保存 到 变量 flag3 
} 
printR" flag=% OMXMNn" , flagt) ; /显示 为 flagF OH 
printf” flags% OMNn" , flag?) ; /显示 为 flag= 13H 
printK”flag3=% OXN\n" , flag3) ; /显示 为 flag3 84H 
return 0; 


| 

上 述 府 入 汇编 _asm { ”} 的 程序 片段 作为 示例 ,先后 3 次 把 标志 寄存 器 的 低 8 位 送 到 寄存 
器 AH 中 ,随即 把 寄存 器 AH 送 到 无 符号 字符 型 变量 中 。 最 后 利用 printf 函数 分 别 显示 输 
出 。 为 了 清楚 地 反映 字 节 变量 的 8 位 值 , 所 以 采用 十 六 进 制 的 形式 。 注 意 ,3 个 字符 型 变量 是 
无 符号 的 。 这 样 通过 观察 程序 运行 的 结果 ,就 可 以 知道 相关 标志 的 变化 情况 。 


2.3.4 带 进位 加 减 指 令 


利用 简单 加 减 指令 ,可 以 方便 地 实现 两 个 8 位 .16 位 或 32 位 数据 的 加 减 运算 。 但 是 ,为 
了 实现 一 组 数据 的 加 减 运算 ,往往 需要 利用 带 进位 的 加 减 运算 指令 。 
1. 带 进 位 加 法 指令 (ADC) 
带 进位 加 法 (Add with Carry ) 指 令 的 格式 如 下 : 
AOLOBT Sm 
这 条 指令 与 ADD 指令 类 似 , 完 成 两 个 操作 数 相 加 ,但 还 要 把 进位 标志 CF 的 当前 值 加 上 ， 
把 结果 送 至 目的 操作 数 DEST, 即 : 
DEST <= DEST+ SRO+ CF 
源 操作 数 SRC 可 以 是 立即 数 、 通 用 寄存 器 或 存储 单元 ,而 目的 操作 数 DEST 可 以 是 通用 
寄存 器 或 存储 单元 。 两 个 操作 数 的 尺寸 必须 一 致 , 可 以 是 一 个 字 节 、 字 或 者 双 字 。 根 据 运 算 结 
果 影 响 各 个 状态 标志 。 这 些 都 与 简单 加 法 指令 ADD 一 样 。 
【 例 2-26】 如 下 指令 片段 演示 带 进位 加 法 指令 ADC 的 使 用 ,分 号 后 是 执行 指令 的 结果 。 


SB EX EX ;EAE 0,0=0 
A EX2 ;ERAE 2,0=0 
STC G1 

A EX2 ;EAE 5, 0=0 


【 例 2-27】 如 下 C 程序 dp26 中 的 嵌入 汇编 代码 片段 ,演示 3 个 单字 节 无 符号 数 相 加 ,为 
了 处 理 可 能 产生 的 进位 ,利用 了 带 进位 的 加 法 指令 。 
#include < stdia h> 
int mair() 
{ 
unsigned char vch= 188 vch2= 12 wd 28; /RB3 个 字 节 变量 


unsigned int sunF 0; /无 符号 整 型 变量 
; // 职 入 汇编 
_asm{ 

SB EX EX /使 BX 为 0, 用 以 存放 累加 和 


AD DL vah /加 第 1 个 字 节 
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Ac Do // 高 8 位 相 加 ( 保持 形式 一 致 ) 
ADD DL vch2 /加 第 2 个 字 节 
Ac Do /高 8 位 相 加 ( 考虑 可 能 出 现 的 进位 ) 
ADD DL vch3 /加 第 3 个 字 节 
Ac Do /高 8 位 相 加 ( 考虑 可 能 出 现 的 进位 ) 
MV sm EX /把 结果 送 到 变量 sm 

有 

printf ”sunF%wWn" ,sum) ; /显示 为 snF 93 

return 0; 


] 

单字 节 无 符号 数 相 加 ,结果 很 可 能 超过 8 位 。 在 上 述 代 码 中 采用 16 位 寄存 器 DX 存放 结 
果 , 每 次 先进 行 低 8 位 相 加 ,然后 进行 高 8 位相 加 ,如 图 2.4 所 示 。 在 高 8 位 相 加 时 ,采用 带 进 
位 的 加 法 指令 ,这 样 就 包括 了 在 低 8 位 相 加 时 可 能 产生 的 进位 。 

另外 ,为 了 便于 存 取 整 型 变量 sum, 所 以 在 上 述 代码 的 首尾 使 用 了 寄存 器 EDX。 





00 xx | 某 字 节 vchi 
CF 

















寄存 器 DX 





DH DL 


2.4 单字 节 无 符号 整数 相 加 示意 图 


2. 带 借 位 减法 指令 (SBB) 

对 加 法 运算 而 言 ,CF 称 为 进位 标志 ,对 减法 运算 而 言 ,CF 称 为 借 位 标志 。 在 进行 多 字 节 
减法 处 理 时 ,往往 要 使 用 到 带 借 位 的 减法 指令 。 

带 借 位 减法 (SuBtraction with Borrow) 指 令 的 格式 如 下 : 

SB LOBT SN 

这 条 指令 与 SUB 指令 类 似 ,在 进行 两 个 操作 数 相 减 的 同时 ,还 要 减 去 借 位 标志 CF 的 当 

前 值 ,再 把 结果 送 至 目的 操作 数 DEST, 即 : 
DEST <= DEST-( SRO+ OF) 

源 操 作 数 SRC 可 以 是 立即 数 .通用 寄存 器 或 存储 单元 ,而 目的 操作 数 DEST 可 以 是 通用 
寄存 器 或 存储 单元 。 两 个 操作 数 的 尺寸 必须 一 致 ,可 以 是 一 个 字 节 、 字 或 者 双 字 。 根 据 运算 结 
果 影 响 各 个 状态 标志 。 这 些 都 与 简单 减法 指令 SUB 一 样 。 

【 例 2-28〗 如 下 指令 片段 演示 带 借 位 减法 指令 SBB 的 使 用 ,分 号 后 是 执行 指令 的 结果 。 


MV 从 CH JAE 0 

SB AL ZH :AE OFFH, OF= 1 
SB 州 2 JAE OFFH, 0=0 
SB M2 ‘AE OfFFH, OF= 0 


2.4 段 寄存 器 及 使 用 


在 IA-32 系列 CPU 中 ,还 有 一 组 段 寄存 器 ,支持 以 分 段 方式 管理 存储 器 。 本 节 首 先 简单 
介绍 存储 器 分 段 的 概念 引出 存储 单元 的 逻辑 地 址 ,然后 说 明 段 寄存 器 及 其 用 途 。 
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2.4.1 存储 器 分 段 


存储 器 由 一 系列 字 节 存储 单元 线性 地 组 成 。 把 CPU 能 够 通过 其 地 址 线 直 接 寻 址 访问 的 
存储 器 称 为 内 存 。 每 一 个 字 节 存储 单元 有 一 个 唯一 的 地 址 , 称 为 物理 地 址 。 如 果 一 个 CPU 
有 nn 根 地 址 线 , 那 么 可 产生 的 最 大 物理 地 址 为 2 一 1, 可 形成 的 物理 地 址 的 范围 为 0 一 2 一 1。 
所 有 可 形成 的 物理 地 址 的 集合 被 称 为 物理 地 址 空间 。 相 应 地 ,所 有 可 能 访问 的 存储 单元 构成 
存储 空间 。 

这 里 可 以 认为 ,IA-32 系列 CPU 有 32 根 地 址 线 ,物理 地 址 空间 的 范围 为 0~~2” 一 1, 用 十 


器 有 20 根 地 址 线 ,可 访问 的 物理 地 址 空间 的 范围 为 0~2” 一 1, 用 十 六 进 制 表示 就 是 00000 到 
FFFFF ,整个 空间 的 规模 是 1MB。 

为 了 有 效 地 管理 存储 器 ,可 以 把 线性 的 物理 地 址 空间 划分 为 若干 逻辑 段 ,对 应 地 存储 空间 
被 划分 为 若干 存储 段 。 可 以 认为 ,逻辑 段 与 存储 段 相 对 应 。 

可 以 按 需要 进行 段 的 划分 。 逻 辑 段 与 逻辑 段 可 以 相连 ,也 可 以 不 相连 ,还 可 以 部 分 重 春 ， 
甚至 完全 重 番 。 

利用 这 样 的 分 段 ,可 以 实现 代码 和 数据 的 隔离 ,也 有 利于 实现 程序 的 重 定 位 。 这 应 该 是 采 
用 分 段 方 式 管理 存储 器 的 原因 之 一 。 一 般 来 说 ,运行 着 的 程序 在 存储 器 中 的 映像 有 三 部 分 组 
成 : 第 一 部 分 是 代码 ,代码 是 要 执行 的 指令 序列 ; 第 二 部 分 是 数据 ,数据 是 要 处 理 加 工 的 对 
象 ; 第 三 部 分 是 堆栈 ,堆栈 是 按 “ 先 进 后 出 ”规则 存 取 的 区 域 。 代 码 ,数据 和 堆栈 往往 分 别 占 用 
不 同 的 存储 器 段 , 相 应 的 段 也 就 被 称 为 代码 段 .数据 段 和 堆栈 段 。 

当然 ,为 了 简化 对 存储 器 的 管理 ,可 以 把 代码 ,数据 和 堆栈 安排 在 同一 个 逻辑 段 内 ,占用 同 
一 个 存储 段 的 不 同 区 域 。 


2.4.2 逻辑 地 址 


在 采用 分 段 存 储 管理 方式 后 ,程序 中 使 用 的 某 个 存储 单元 总 是 属于 某 个 段 。 于 是 可 以 采 
用 某 段 某 单元 的 方式 表示 存储 单元 。 
在 程序 中 用 于 表示 存储 单元 的 地 址 称 为 逻辑 地 址 。 逻 辑 地 址 是 二 维 的 ,第 一 维 表示 某 段 ， 
第 二 维 表示 段 内 的 某 单元 。 某 段 可 以 由 段 的 编号 来 给 出 , 某 单元 可 以 通过 该 单元 的 段 内 地 址 
来 给 出 。 因 此 ,二 维 的 逻辑 地 址 可 以 表示 为 : 
段 号 : 段 内 地 址 
把 存储 单元 的 物理 地 址 与 所 在 段 的 起 始 地 址 的 差 称 为 段 内 偏 移 ,简称 偏 移 。 段 内 地 址 就 
是 段 内 偏 移 , 也 就 是 偏 移 。 于 是 ,二 维 的 逻辑 地 址 可 以 表示 为 ， 
段 号 : 偏 移 
在 实地 址 方式 和 保护 方式 下 ,都 通过 偏 移 指 定 段 内 的 某 单元 。 但 在 指定 某 段 ,或 者 说 表示 
段 号 时 ,实地 址 方式 与 保护 方式 却 是 不 相同 的 。 在 实地 址 方式 下 ,上 述 段 号 是 段 值 ; 在 保护 方 
式 下 ,上 述 段 号 则 是 段 选择 子 。 在 第 6 章 将 说 明 段 值 ,在 第 9 章 将 介绍 段 选择 子 。 
在 访问 存储 器 中 的 存储 单元 之 前 ,必须 先 得 到 要 访问 的 存储 单元 的 物理 地 址 。 也 就 是 说 ， 
需要 把 逻辑 地 址 转换 为 物理 地 址 。 根 据 偏 移 的 定义 可 知 : 
物理 地 址 一 段 起 始 地 址 十 偏 移 
在 实地 址 方式 下 , 巾 段 值 可 以 得 到 段 起 始 地 址 ; 在 保护 方式 下 ,根据 段 选择 子 可 以 得 到 
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段 起 始 地 址 。 总 之 , 巾 段 号 可 以 得 到 段 起 始 地 址 。 所 以 ,由 二 维 的 逻辑 地 址 可 以 转换 成 一 
维 的 物理 地 址 。 人 逻辑 地 址 转换 为 物理 地 址 的 过 程 归纳 为 : 由 段 号 得 到 段 起 始 地 址 ,再 加 上 
偏 移 。 

如 果 整 个 程序 只 有 一 个 段 或 程序 的 代码 段 .数据 段 .堆栈 段 在 同一 个 逻辑 段 中 ,那么 可 以 
认为 二 维 的 逻辑 地 址 就 退化 成 一 维 的 逻辑 地 址 。 在 这 种 情况 下 ,由 于 段 起 始 地 址 完全 相同 , 偏 
移 就 决定 了 一 切 。 

可 以 简单 认为 ,在 保护 方式 下 ,物理 地 址 是 32 位 , 段 起 始 地 址 是 32 位 , 偏 移 也 是 32 位 ; 
在 实地 址 方式 下 ,物理 地 址 是 20 位 , 段 起 始 地 址 是 20 位 ,而 偏 移 是 16 位 。 


2.4.3 上段 寄存 器 


在 一 个 已 确定 的 段 内 ,只 需 通过 偏 移 便 可 指定 要 访问 的 存储 单元 ,所 以 程序 中 绝 大 部 分 涉 
及 存储 器 访问 的 指令 都 只 给 出 偏 移 。 

逻辑 地 址 中 的 段 号 ( 段 值 或 者 段 选择 子 ) 存 放 在 哪里 呢 ? 答案 是 ,当前 使 用 段 的 段 号 存放 
在 段 寄 存 器 (Segment Registers) 中 。 

早先 的 Intel 8086 处 理 器 有 4 个 段 寄存 器 ,分 别 是 代码 段 (Code Segment) 寄 存 器 CS 、 堆 
栈 段 (Stack Segment) 寄存 器 SS、 数 据 段 (Data Segment) 寄存 器 DS 和 附加 段 (Extra 
Segment) 寄 存 器 ES。 

从 Intel 80386 处 理 器 开始 ,又 增加 了 两 个 段 寄存 器 ,分 别 是 FS 和 GS。 这 两 个 段 寄存 
器 也 是 附加 段 寄 存 器 ,所 以 顺 着 ES 命名 它们 。 因 此 ,现在 的 IA-32 系列 CPU 有 6 个 段 
寄存 器 。 

这 6 个 段 寄存 器 的 可 见 部 分 的 长 度 都 是 16 位 。 在 实地 址 方式 下 ,用 于 存放 16 位 的 段 值 ; 
在 保护 方式 下 ,用 于 存放 16 位 的 段 选 择 子 。 

从 这 些 段 寄存 器 的 名 称 就 可 以 知道 它们 的 作用 。 由 代码 段 寄存 器 CS 指定 当前 代码 段 ， 
由 堆栈 段 寄存 器 SS 指定 当前 堆栈 段 , 由 数据 段 寄 存 器 DS 指定 当前 数据 段 。 附 加 段 寄 存 器 
ES、FS、GS 也 被 用 于 指定 数据 段 。 对 于 数据 段 , 一 般 默 认 情 况 将 引用 数据 段 寄 存 器 DS, 特 殊 
默认 情况 将 引用 堆栈 段 寄存 器 SS。 在 2. 5. 2 节 有 关于 引用 段 寄存 器 的 进一步 说 明 。 

从 上 述 逻 辑 地 址 到 物理 地 址 的 转换 过 程 可 知 ,在 访问 存储 单元 时 ,CPU 先 根据 对 应 的 段 
寄存 器 得 到 段 起 始 地 址 ,再 加 上 指定 的 偏 移 ,得 到 存储 单元 的 物理 地 址 。 

如 果 整 个 程序 只 有 一 个 段 或 者 程序 的 代码 段 .数据 段 、 堆 栈 段 占 用 同一 个 存储 段 ,那么 代 
码 段 寄存 器 CS 数据 段 寄 存 器 DS 和 堆栈 段 寄存 器 SS 等 指定 同一 个 存储 段 ,给 出 相同 的 段 起 
始 地 址 。 甚 至 如 果 由 段 寄 存 器 给 出 的 段 起 始 地 址 是 0, 那 么 偏 移 就 相当 于 物理 地 址 。 

利用 传送 指令 MOV 可 以 存 取 段 寄存 器 中 的 段 值 或 者 段 选择 子 。 

【 例 2-29】 如 下 指令 演示 存 取 段 寄存 器 中 的 段 值 或 者 段 选择 子 , 分 号 之 后 是 解释 。 


MV A Ds :把 哈 中 的 段 值 或 者 段 选择 子 送 到 以 
WW ESM :把 以 中 的 值 送 到 区 
MW DOCS :把 GB 中 的 段 值 或 者 段 选择 子 送 到 DX 


注意 ,代码 段 寄存 器 CS 不 能 作为 目标 ,不 能 显 式 地 改变 代码 段 寄存 器 CS。 另 外 ,不 能 把 
立即 数 直接 传送 到 段 寄 存 器 。 
还 需要 注意 ,在 保护 方式 下 ,应 用 程序 不 宜 改变 段 寄 存 器 的 值 。 





2.5 寻 址 方式 


表示 指令 中 操作 数 所 在 的 方法 称 为 寻 址 方式 。CPU 常用 的 寻 址 方式 可 分 为 三 大 类 : 立 
即 寻 址 、 寄 存 器 寻 址 和 存储 器 寻 址 ,此 外 还 有 固定 寻 址 和 1/O 端口 寻 址 等 。 本 节 首 先 介绍 立 
即 寻 址 和 寄存 器 寻 址 方式 ,然后 介绍 IA-32 系列 CPU 的 32 位 存储 器 寻 址 方式 ,最 后 介绍 有 多 
用 途 的 取 有 效 地 址 指令 。 


2.5.1 立即 寻 址 方式 和 寄存 器 寻 址 方式 


在 本 章 前 几 节 的 示例 中 ,大 多 数 指令 采用 了 立即 寻 址 方式 或 寄存 器 寻 址 方式 。 

1. 立即 寻 址 方式 

操作 数 本 身 就 包含 在 指令 中 ,直接 作为 指令 的 一 部 分 给 出 。 把 这 种 寻 址 方式 称 为 立即 寻 
址 方式 。 把 这 样 的 操作 数 称 为 立即 数 。 

IA-32 系列 CPU 允许 32 位 的 立即 数 。 当 然 , 立 即 数 也 可 以 是 8 位 或 16 位 。 

【 例 2-30】 在 如 下 指令 中 , 源 操作 数 采用 立即 寻 址 方式 。 


MY EM 12345678H; ;给 杖 赋 初 值 
AD BX 1234 ;给 区 加 上 值 12341 
SB ‘GQ2 ;从 QL 减 去 值 2 


立即 数 作为 指令 的 一 部 分 , 跟 在 操作 码 后 存放 在 代码 段 中 。 只 有 源 操作 数 才 可 采用 立即 
寻 址 方式 ,目的 操作 数 不 能 采用 立即 寻 址 方式 。 如 果 目 的 操作 数 采用 立即 寻 址 方式 , 那 就 意味 
着 执行 指令 后 ,指令 本 身 就 会 发 生 改 变 。 所 以 ,在 各 种 指令 中 ,立即 数 是 不 能 作为 目的 操作 
数 的 。 

如 果 立 即 数 由 多 个 字 节 构成 ,那么 在 作为 指令 的 一 部 分 存储 时 ,也 采用 “高 高 低 低 ”规则 ， 
也 就 是 高 位 字 节 在 高 地 址 存储 单元 ,低位 字 节 在 低地 址 存储 单元 。 

由 于 立即 寻 址 方式 的 操作 数 是 立即 数 , 含 在 指令 中 ,因此 执行 指令 时 ,不 需要 青 到 存储 器 
中 去 取 该 操作 数 。 

【 例 2-31】 在 如 下 指令 中 , 源 操作 数 是 立即 数 ,虽然 其 值 都 是 1, 但 其 尺寸 (数据 位 数 ) 却 
是 不 一 样 的 。 


WwW EX 1 源 操作 数 是 尼 位 

WW D1 源 操作 数 是 6 位 

WwW D1 源 操作 数 是 8 位 
这 是 因为 传送 指令 MOV 的 两 个 操作 数 的 尺寸 必须 一 致 。 
2. 寄存 器 寻 址 方式 


操作 数 在 CPU 内 部 的 寄存 器 中 ,指令 中 指定 寄存 器 。 把 这 种 寻 址 方式 称 为 寄存 器 寻 址 
方式 。 寄 存 器 可 以 是 8 个 32 位 的 通用 寄存 器 (EAX、EBX、ECX、EDX、ESI、 EDI、 EBP 和 
ESP) ,也 可 以 是 8 个 16 位 的 通用 寄存 器 (AX、BX、CX、DX、SI、DI、BP 和 SP) ,还 可 以 是 8 个 8 
位 的 通用 寄存 器 (AL、AH、BL、BH、CL、CH.、DL 和 DH)。 

在 例 2-30 和 例 2-31 中 ,目的 操作 数 都 采用 了 寄存 器 寻 址 方式 。 

【 例 2-32】 在 如 下 指令 中 , 源 操作 数 和 目的 操作 数 都 采用 寄存 器 寻 址 方式 。 

WW ”EBP EP :把 即 的 值 送 到 E 
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AD EX EX 把 慌 的 值 与 BX 的 值 相 加 ,结果 送 到 EX 
SB Dl,BX :把 01 的 值 减 去 区 的 值 ,结果 送 到 DI 
Xr MHD ;交换 用 与 叫 的 值 


由 于 操作 数 在 寄存 器 中 ,不 需要 通过 访问 存储 器 来 取得 操作 数 , 因 此 采用 寄存 器 寻 址 方式 
的 指令 执行 速度 较 快 。 


2.5.2 32 位 的 存储 器 寻 址 方式 


许多 指令 的 操作 数 可 以 在 存储 单元 中 ,指定 存储 单元 就 指定 了 操作 数 。 从 2.4 节 可 知 ,在 
一 个 段 内 ,通过 偏 移 就 能 够 指定 存储 单元 ,所 以 ,一 般 情况 下 访问 存储 单元 的 指令 只 需要 给 出 
存储 单元 的 偏 移 。 存 储 器 寻 址 方式 是 指 给 出 存储 单元 偏 移 的 方式 。 采 用 32 位 的 存储 器 寻 址 
方式 ,能 够 给 出 32 位 的 偏 移 。 为 了 灵活 方便 地 访问 存储 器 ,IA-32 系列 CPU 提供 了 多 种 表示 
存储 单元 偏 移 的 方式 。 换 句 话说 ,有 多 种 存储 器 寻 址 方式 。 

通常 把 要 访问 的 存储 单元 的 段 内 偏 移 称 为 有 效 地 址 (Effective Address,EA)。 在 32 位 存 
储 器 寻 址 方式 下 ,存储 单元 的 有 效 地 址 可 达 32 位 。 

1. 直接 寻 址 方式 

操作 数 在 存储 器 中 ,指令 直接 包含 操作 数 所 在 存储 单元 的 有 效 地 址 ,这 种 寻 址 方式 称 为 直 
接 寻 址 方式 。 

【 例 2-33】 如 下 指令 演示 直接 寻 址 方式 的 使 用 ,其 中 后 级 了 H 表示 十 六 进 制 。 


MY EX [95480H] ; 源 操作 数 采 用 直接 寻 址 
MV [9540H], DX ;目的 操作 数 采用 直接 寻 址 
AD BL [9548H ; 源 操作 数 采 用 直接 寻 址 


注意 ,立即 寻 址 和 直接 寻 址 书写 表示 上 的 不 同 。 直 接 寻 址 的 地 址 要 放 在 方 括号 中 ,在 源 程 
序 中 ,往往 用 变量 名 表示 。 

【 例 2-34】 假设 数据 段 和 代码 段 重要 ,由 段 寄 存 器 CS 和 DS 得 到 的 段 起 始 地 址 都 是 0， 
有 效 地 址 为 01234567H 的 双 字 存储 单元 中 的 内 容 是 4F5A9687H ,那么 在 执行 指令 “MOV 
EAX,[01234567HJ” 后 寄存 器 EAX 的 内 容 是 4F5A9687H。 图 2.5 列 出 了 该 指令 的 存储 和 执 
行情 况 , 其 中 数据 都 采用 十 六 进 制 表示 。 

在 图 2. 5 中 的 标记 op 表示 该 指令 的 操作 码 , 其 后 4 个 字 节 是 要 访问 的 存储 单元 有 效 地 
址 。 阴 影 部 分 表示 要 访问 的 存储 单元 ,因为 假设 所 在 段 的 起 始 地 址 为 0, 所 以 指令 中 直接 给 出 
的 有 效 地 址 01234567H 就 是 物理 地 址 。 目 的 操作 数 是 32 位 的 寄存 器 EAX, 源 操作 数 当 然 是 
双 字 (4 个 字 节 ) 存 储 单元 。 如 果 目 的 操作 数 是 寄存 器 AL ,那么 涉及 的 源 操作 数 仅 是 一 个 字 节 
存储 单元 。 

2. 寄存 器 间接 寻 址 方式 

操作 数 在 存储 器 中 ,由 8 个 32 位 的 通用 寄存 器 之 一 给 出 操作 数 所 在 存储 单元 的 有 效 地 
址 。 把 这 种 通过 寄存 器 间接 给 出 存储 单元 有 效 地 址 的 方式 称 为 寄存 器 间接 寻 址 方式 。 

【 例 2-35】 如 下 指令 演示 寄存 器 间接 寻 址 方式 的 使 用 。 

MV EMX [ES 源 操 作 数 寄存 器 间接 寻 址 , ESI 给 出 有 效 地 址 


MV [emU,Q ;目的 操作 数 寄存 器 间接 寻 址 , 印 ! 给 出 有 效 地 址 
SB DX [EX ; 源 操作 数 寄存 器 间接 寻 址 ,EX 给 出 有 效 地 址 
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2.5 直接 寻 址 方式 示意 图 


注意 ,在 书写 汇编 格式 指令 表示 寄存 器 间接 寻 址 方式 时 ,一 定 要 把 寄存 器 名 放 在 方 括号 
中 。 下 面 两 条 指令 的 目的 操作 数 的 寻 址 方式 完全 不 同 : 

WW [ESD, EX ;目的 操作 数 采 用 寄存 器 间接 寻 址 方式 
MX ESl, EX ;目的 操作 数 采用 寄存 器 寻 址 方式 

在 寄存 器 间接 寻 址 方式 中 ,给 出 操作 数 所 在 存储 单元 有 效 地 址 的 寄存 器 ,相当 于 C 语言 
中 的 指针 变量 , 它 含 有 要 访问 存储 单元 的 地 址 。 

3. 32 位 存储 器 寻 址 方式 的 通用 表示 

IA-32 系列 CPU 支持 灵活 的 32 位 有 效 地 址 的 存储 器 寻 址 方式 。 上 述 存储 器 直接 寻 址 和 
寄存 器 间接 寻 址 只 是 两 个 具体 情形 。 

在 IA-32 系列 CPU 中 ,存储 单元 的 有 效 地 址 可 以 由 三 部 分 内 容 相 加 构成 : 一 个 32 位 的 
基地 址 寄存 器 ,一 个 可 乘 上 比例 因子 1.2、4 或 8 的 32 位 变 址 寄存 器 ,以 及 一 个 8 位 、16 位 或 
32 位 的 位 移 量 。 并 且 , 这 三 部 分 可 省 去 任意 的 两 部 分 。 

图 2.6 给 出 了 32 位 有 效 地 址 EA 的 各 种 可 能 的 表示 形式 。 其 中 ,位 移 量 采 用 补 码 形式 表 
示 ,在 计算 有 效 地 址 时 ,如 位 移 量 是 8 位 或 者 16 位 , 则 被 带 符号 扩展 成 32 位 。 从 图 2.6 可 知 ， 
8 个 32 位 通用 寄存 器 都 可 以 作为 基 址 寄存 器 ; 除 ESP 寄存 器 外 ,其 他 7 个 通用 寄存 器 都 可 以 
作为 变 址 寄存 器 。 








基 址 变 址 比例 位 移 量 

EAX EAX 

EBX a 
EBX 8 位 

ECX 1 

EDX EC 2 

BA = EDX | x 让 16 位 

ESP 4 

EBP Eb 8 

ESI ESI 32 位 
EDI 

EDI 


























图 2.6 32 位 有 效 地 址 ( 偏 移 ) 的 计算 式 
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从 图 2. 6 可 知 ,如果 缺 省 基 址 寄存 器 部 分 和 变 址 寄存 器 部 分 ,只 剩 下 位 移 量 部 分 ,那么 就 
是 直接 寻 址 。 如 果 缺 省 变 址 寄存 器 部 分 和 位 移 量 部 分 ,只 剩 下 基 址 寄存 器 部 分 ,那么 就 是 寄存 
器 间接 寻 址 。 

如 果 有 效 地址 由 基 址 寄存 器 和 位 移 量 两 部 分 相 加 给 出 ,这 样 的 寻 址 方式 常 被 称 为 寄存 器 
相对 寻 址 方式 。 

【 例 2-36】 如 下 指令 演示 存储 器 操作 数 的 寄存 器 相对 寻 址 方式 的 使 用 ,其 中 后 级 HH 表示 
十 六 进 制 。 


MV EAX [EBX+ 1 源 操作 数 有 效 地 址 是 轧 值 加 上 全 
MV [ES-4], AL ;目的 操作 数 有 效 地 址 是 BI 值 减 去 4 
ADD DX [ECX+ 53228H] 源 操 作 数 有 效 地 址 是 EX 值 加 上 5228H 


如 果 有 效 地 址 由 基 址 寄存 器 和 变 址 寄存 器 两 部 分 相 加 给 出 ,这 样 的 寻 址 方式 常 被 称 为 基 
址 加 变 址 寻 址 方式 。 
【 例 2-37】 如 下 指令 演示 存储 器 操作 数 的 基 址 加 变 址 寻 址 方式 的 使 用 。 


MY EMX, [EBX+ ESD] 源 操 作 数 有 效 地 址 是 轧 值 加 上 BI 值 
SB [EX+ED,AL ;目的 操作 数 有 效 地 址 是 EX 值 加 上 钙 ! 值 
XOHG [EBX+ ESD, DX ;目的 操作 数 有 效 地 址 是 蚊 值 加 上 ESI 值 


如 图 2.6 所 示 ,在 32 位 有 效 地 址 的 存储 器 寻 址 方式 中 , 变 址 寄存 器 还 可 以 乘 上 一 个 放大 
因子 ,放大 因子 可 以 是 1.2、4、8。 如 果 含 变 址 寄存 器 ,那么 把 变 址 寄存 器 中 的 值 先 按 给 定 的 比 
例 因 子 放大 ,再 用 于 计算 有 效 地 址 。 

【 例 2-38】〗 如 下 指令 演示 32 位 有 效 地 址 的 存储 器 寻 址 方式 的 使 用 。 


MO EMX, [ECX+ EB 4] ;EM 作为 变 址 寄存 器 ,放大 因子 是 4 
MX [EAX+ ECX+ 2], DL ;EX 作为 变 址 寄存 器 ,放大 因子 是 2 
AD 以 [EBX+ ESI*8] :BS1 作为 变 址 寄存 器 ,放大 因子 是 8 
SB EX [EDXr EAX-4] ;EM 作为 变 址 寄存 器 ,放大 因子 是 1 


WW ERX [LEI+ EA 4 300H ;EM 作为 变 址 寄存 器 ,放大 因子 是 4 

【 例 2-39】 假设 根据 数据 段 寄存 器 DS 得 到 的 段 起 始 地 址 是 0, 寄存 器 EDI 的 内 容 是 
51234H ,寄存 器 EAX 的 内 容 是 6. 并 且 有 效 地 址 为 0005154CH 的 双 字 存储 单元 的 内 容 是 
44434241H, 图 2.7 演示 了 执行 指令 “MOV EBX,[EDI 二 EAX x 4 十 300HJ” 的 情况 ,其 中 数 
据 都 采用 十 六 进 制 表示 。 

在 图 2.7 中 ,以 EDI 作为 基地 址 ,以 300H 作为 相对 位 移 量 ,再 加 上 EAX 寄存 器 值 的 4 倍 
作为 调节 ,得 到 有 效 地 址 0005154CH。 也 可 以 理解 为 : 以 EDI 作为 基地 址 ,加 上 EAX 值 的 4 
倍 作为 调节 ,再 加 上 300H 的 位 移 量 , 得 到 有 效 地 址 。 同 时 ,根据 数据 段 寄存 器 DS 得 到 的 起 始 
地 址 为 0, 所 以 访问 的 存储 单元 的 物理 地 址 就 是 有 效 地 址 0005154CH。 

【 例 2-40】 如 下 C 程序 dp27 中 的 租 入 汇编 代码 ,演示 32 位 存储 器 寻 址 方式 的 使 用 , 同 
时 演示 字 节 存储 单元 与 双 字 存储 单元 的 关系 等 。 


#include < stdioh> // 锭 示 程 序 27 

int vari= 0x12345678; /定义 整 型 变量 . 设 有 效 地 址 为 x 

char buffL ]= " ABCDE" ; /定义 字符 数组 . 设 首 元 素 有 效 地 址 为 y 
int mair() 


{ 
int i, 2 dv3 dv4; /定义 4 个 整 型 变量 





/ 嵌 人 汇编 
_asm[ 
LEA EX vari /把 变量 vari 的 有 效 地 址 x 送 到 本 
MW ”EAX [EBM /把 有 效 地 址 为 x 的 双 字 ( 12345678H) 送 到 EX 
MV ov, EX 
WW EMX [BX /把 有 效 地 址 为 x+1 的 双 字 ( 4123469) 送 到 EMX 
MOV dh2 EX 
MV EX 2 
MV 以 [EBX+ EX] /把 有 效 地 址 为 x+2 的 字 ( 12340) 送 到 以 
MOV dh3 EX 
MN ”AL，[EBX+ EX 2+3] /把 有 效 地 址 为 x+ 7 的 字 节 ( 4H) 送 到 AL 
WW 4 EX 
} 
printf ”dv 人 =% O84N\n" ,dv1) ; /显示 为 v= 12345678H 
printRk" dy2=% ONn" ,dv2) ; /显示 为 = 41123454H 
printf"” dv3=% O84Nn" ,dv3) ; /显示 为 dv3= 1121234H 
printRk" dv % ON n" ,dv) ; /显示 为 dv 4121244 
retum 0; 


} 

上 述 C 程 序 开始 部 分 定义 的 全 局 整 型 变量 vari 和 字符 数组 buff 占用 的 存储 空间 如 图 2. 8 
所 示 。 假 设 整 型 变量 vari 首 字 节 的 有 效 地 址 是 zx, 设 字符 数组 buff 首 元素 的 有 效 地 址 是 y。 
由 于 是 初始 化 好 的 全 局 变量 ,这 些 字 节 是 连续 的 。 图 中 字 节 存储 单元 中 的 数值 采用 十 六 进 制 
表示 。 上 述 租 入 汇编 代码 片段 的 第 一 条 指令 “LEA EBX,， vari” 是 取 有 效 地 址 指令 ,功能 是 把 
变量 vari 对 应 的 存储 单元 的 有 效 地 址 送 到 寄存 器 EBX。 在 本 节 的 最 后 ,将 介绍 取 有 效 地 址 指 
令 。 从 上 述 嵌 入 汇编 代码 片段 可 知 ,利用 灵活 的 32 位 存储 器 寻 址 方式 ,可 以 方便 地 存 取 双 字 、 
字 或 字 节 存储 单元 。 
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图 2.7 32 位 有 效 地 址 的 存储 器 寻 址 方式 示意 图 
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2.8 全 局 变量 的 存储 示意 图 


4. 关于 存储 器 寻 址 方式 的 说 明 

(1) 如 果 指 令 的 操作 数 允 许 是 存储 器 操作 数 ,那么 上 面 介绍 的 各 种 存储 器 寻 址 方式 都 
适用 。 

(2) 存储 器 操作 数 的 尺寸 可 以 是 字 节 、 字 或 者 双 字 。 在 某 条 具体 的 指令 中 ,如 果 有 存储 器 
操作 数 ,那么 其 尺寸 是 确定 的 。 在 大 多 数 情况 下 ,存储 器 操作 数 的 尺寸 是 一 目 了 然 的 ,因为 通 
常 要 求 一 条 指令 中 的 多 个 操作 数 的 尺寸 一 致 ,所 以 指令 中 寄存 器 操作 数 的 尺寸 就 决定 了 存储 
器 操作 数 的 尺寸 。 在 少数 情况 下 ,需要 显 式 地 指定 存储 器 操作 数 的 尺寸 。 

【 例 2-41〗 如 下 C 程序 dp28 及 其 嵌入 汇编 代码 ,演示 显 式 地 标明 存储 器 操作 数 的 尺寸 。 
演示 思路 为 : 利用 MOV 指令 ,采用 直接 寻 址 方式 ,分 别 给 3 个 整 型 变量 赋值 ; 还 采用 寄存 器 
相对 寻 址 方式 ,分 别 给 数组 的 3 个 元 素 赋值 ; 然后 观察 显示 输出 。 

#include < stdio.h> /演示 程序 中 2 

int varf= 0x33333333，var 估 0kd4444444，var3- 0x55555555; 

int bufi[3]={ 0k66666666 Ox77777777, 0868885558} ; 


int mair() 
{ 
_asm{ /嵌入 汇编 代码 
MV varl,9 / 双 字 存储 单元 
MV WORD PTR var2 9 // 字 存储 单元 
MV BYEPIRvar3 9 / 字 节 存储 单元 
} 
printg" % 0BHNn" ,var1) ; /显示 为 00000009H 
printf" % 0OBHNn" ,var2) ; /显示 为 444000H 
printf" % O84Nn” ,var3) ; /显示 为 5555509H 
an / 锐 入 汇编 代码 
LEA EX bufi /把 bufi 的 有 效 地 址 送 到 EX 
MV DWORD PTR [EEX], 5 / 双 字 存 储 单元 
MV WORD PTR [EEX+ 4], 5 // 字 存储 单元 
MV BYTE PTR [EBX+ 8§], 5 / 字 节 存储 单元 


新 概念 汇编 语言 





printf" %OBXNn" ,bufiLO ) ; /显示 为 00000005H 
printf" % 0OBXNn" ,bufi[ 估 ) ; /显示 为 77770006H 
printk" % 0OBXNn"” ,bufi[ 习 ) ; /显示 为 85588805H 
retum 0; 


] 

在 上 述 嵌 入 汇编 代码 中 ,MOYV 指令 中 的 一 个 操作 数 是 立即 数 , 像 9 和 5 这 样 的 立即 数 的 
尺寸 不 确定 ,可 以 认为 是 8 位 ( 字 节 )、16 位 ( 字 ) 或 者 32 位 ( 双 字 ), 所 以 需要 显 式 地 指定 存储 
器 操作 数 尺 寸 。 其 中 的 “BYTE PTR”“WORD PTR” 等 用 于 指定 存储 器 操作 数 尺寸 。 就 指 
令 “MOV DWORD PTR [EBX],5” 而 言 ,访问 的 存储 单元 是 双 字 ,假设 数组 bufi 首 元 素 
(bufi[0]) 的 有 效 地 址 是 zx, 那么 该 指令 访问 的 存储 单元 包括 了 从 zz 开始 到 xz 十 3 结束 的 4 个 字 
节 单 元 。 把 立即 数 5 作为 32 位 处 理 ,指令 执行 后 ,有 效 地 址 x 处 字 节 单元 的 内 容 是 5, 其 他 3 
个 字 节 单元 的 内 容 均 是 0。 另外 ,由 于 变量 varl 是 整 型 变量 ,因此 默认 为 双 字 (32 位 ) 存 储 
单元 。 

(3) 在 32 位 的 存储 器 寻 址 方式 中 ,如 果 基 址 寄存 器 不 是 EBP 或 者 ESP, 那 么 默认 引用 的 
段 寄存 器 是 DS; 如 果 基 址 寄存 器 是 EBP 或 者 ESP, 那 么 默认 引用 的 段 寄 存 器 是 SS。 当 EBP 
作为 变 址 寄存 器 使 用 (ESP 不 能 作为 变 址 寄存 器 使 用 ) 时 ,默认 引用 的 段 寄 存 器 仍然 是 DS。 

(4) 无 论 存储 器 寻 址 方式 简单 还 是 复杂 ,如 果 由 基 址 寄存 器 . 带 比例 因子 的 变 址 寄存 器 和 
位 移 量 这 三 部 分 相 加 所 得 超过 32 位 ,那么 有 效 地 址 仅 为 低 32 位 。 

(5) 在 实地 址 方式 下 ,存储 单元 的 有 效 地 址 不 应 该 超过 FFFFH。 在 32 位 存储 器 寻 址 方 
式 中 ,由 于 按 32 位 计算 有 效 地 址 ,有 效 地 址 可 能 超过 FFFFH。 在 实 方式 下 ,如 果 发 生 这 种 情 
况 , 则 会 引起 异常 。 在 第 9 章 中 ,将 介绍 异常 及 其 处 理 。 


2.$.3 取 有 效 地 址 指令 


IA-32 系列 CPU 提供 了 一 条 取 有 效 地 址 的 指令 ,为 了 进一步 加 强 对 存储 器 寻 址 方式 的 理 
解 , 下 面 将 介绍 取 有 效 地 址 指令 。 

1. 取 有 效 地 址 指令 

取 有 效 地 址 (Load Effective Address) 指 令 的 格式 如 下 : 

I ABOD 

该 指令 把 操作 数 OPRD 的 有 效 地 址 传送 到 操作 数 REG。 源 操作 数 OPRD 必须 是 一 个 存 
储 器 操作 数 , 目 的 操作 数 REG 必须 是 一 个 16 位 或 者 32 位 的 通用 寄存 器 。 

该 取 有 效 地 址 指令 不 影响 各 标志 。 

【 例 2-42】 如 下 指令 片段 演示 取 有 效 地 址 指令 LEA 的 功能 ,指令 执行 的 结果 作为 注释 ， 
后 绥 H 表示 十 六 进 制 数 。 


WW EI, 512341 :DI= 00051234 
WwW EX6 ;EAX= 00000004H 
LEA ESI, [BI+ EM] ;ESI= 0005123MH 
LEA EX [EA :ECE 00000018H 
LEA EX [I+ EA 4 300H] ;BE 00051540H 


注意 ,LEA 指令 与 把 存储 单元 中 的 数据 传送 到 寄存 器 的 MOV 指令 有 本 质 上 的 区 别 。 
例 2-39 中 的 指令 “MOV EBX,[EDI+TEAX* 4 十 300HJ” 是 把 对 应 存储 单元 的 内 容 传送 到 寄 
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存 器 EBX; 而 例 2-42 中 的 指令 “LEA EBX,[EDI+TEAX*4 二 300H]” 是 把 对 应 存储 单元 的 
有 效 地 址 传送 到 寄存 器 EBX。 

如 果 LEA 指令 中 的 源 操作 数 OPRD 的 有 效 地 址 采用 32 位 存储 器 寻 址 方式 表示 ,而 目的 
操作 数 REG 是 16 位 通用 寄存 器 ,那么 只 把 有 效 地 址 的 低 16 位 送 到 16 位 通用 寄存 器 。 如 果 
LEA 指令 中 的 源 操 作 数 OPRD 的 有 效 地 址 采用 16 位 存储 器 寻 址 方式 表示 (将 在 第 6 章 中介 
绍 ) ,而 目的 操作 数 REG 是 32 位 通用 寄存 器 ,那么 把 16 位 有 效 地 址 无 符号 扩展 成 32 位 ,并 送 
到 32 位 通用 寄存 器 。 

【 例 2-43】〗 如 下 CC 程序 dp29 中 的 嵌入 汇编 代码 片段 ,演示 取 有 效 地 址 指令 的 使 用 ,同时 
也 可 以 看 到 C 语言 中 指针 的 本 质 是 地 址 。 


#include < stdio h> /演示 程序 2 
char dx, dhy; // 全 局 字符 变量 
int mair() 
{ 
char * pl, * p2; /两 字符 型 指针 变量 
/ 赔 入 汇编 代码 之 一 
_asm{ 
LEA EM dx // 取 变量 dx 的 存储 单元 有 效 地 址 
MV pl, EM // 送 到 指针 变量 pl 
LEA EX dy // 取 变量 dy 的 存储 单元 有 效 地 址 
MY peEX // 送 到 指针 变量 取 
】 
printf”lIrput:”) ; // 提 示 
scanf" % oe" ,p1) ; /键盘 输入 一 个 字符 
/嵌入 汇编 代码 之 二 
_asm{ 
MV ESl, pi // 取 回 变 量 dx 的 有 效 地 址 
MW Bl,p2 / 取 回 变量 gy 的 有 效 地 址 
WW A, [ES // 取 变量 dx 的 值 
WW [ED ,全 // 送 到 变量 gy 中 
] 
printk" ASCII:% ON n" ,*p2) ; /十 六 进 制 形式 显示 对 应 的 Ascll 码 值 
retumn 0; 


] 

在 上 述 C 程序 中 ,作为 演示 利用 嵌入 汇编 代码 ,给 两 个 指针 变量 赋值 ,使 其 分 别 指向 两 个 
字符 变量 ; 还 利用 嵌入 汇编 代码 实现 把 变量 chx 的 值 送 到 变量 chy。 此 外 ,利用 C 语言 实现 输 
入 和 输出 。 

【 例 2-44】 如 下 CC 程序 dp210 中 的 嵌入 汇编 代码 片段 ,演示 32 位 存储 器 寻 址 方式 的 使 
用 ,同时 也 演示 取 有 效 地 址 指令 的 使 用 。 


#include < stdio.h> /演示 程序 210 

int iarr[5]={5 8 -23 8 10: // 整 型 数组 

doble darr[5]={ 9.8 277 3145726 144 1.73778} : / 双 精 度 浮 点 数组 
int mair() 


{ 
int ival; //( 整 型 变量 





double dval; / 双 精 度 浮 点 
1/ 嵌入 汇编 
_asn{ 
LEA EX iarr // 把 整 型 数组 首 元 素 的 有 效 地 址 送 至 EBX 
WW EX3 
MV EX [EBX+ EX /取出 iarr 的 第 3 个 元 素 
MV ival, EX 
LEA ESI, darr /把 浮 点 数组 首 元 素 的 有 效 地 址 送 至 ESI 
LEA EI, dval /把 变量 dval 的 有 效 地 址 送 至 印 | 
MV EX 2 
MV EAX [ESI+ECX+g] / 取 darr 的 第 2 个 元 素 的 低 双 字 
MV EX [ESI+ ECxk 8+ / 取 darr 的 第 2 个 元 素 的 高 双 字 
MV [em], EX // 保 存 低 双 字 
MV [I+4, EX // 保 存 高 双 字 
printRk" iVA=%d\n" ,ival) ; /显示 为 WW= 8 
printk" dA=%.8A\n" ,dval) ; /显示 为 WAL= 3 141920 
retum 0; 


} 
从 上 述 嵌 入 汇编 代码 片段 可 知 ,在 32 位 存储 器 操作 数 寻 址 方式 中 ,针对 变 址 寄存 器 的 比 
例 因 子 的 作用 。 
2. 取 有 效 地 址 指令 的 应 用 
取 有 效 地 址 指令 LEA 还 有 另外 一 种 作用 。 如 图 2.6 所 示 , 有 效 地 址 可 以 由 三 部 分 构成 ， 
所 以 利用 LEA 指令 可 以 比较 高 效 地 实现 把 基 址 寄存 器 中 的 内 容 与 变 址 寄存 器 中 的 内 容 相 
加 ,并 把 结果 送 到 另 一 个 寄存 器 ,甚至 处 理 更 复杂 的 情况 。 
【 例 2-45】 现 通过 高 级 语言 源 程序 的 目标 代码 来 说 明 LEA 指令 的 作用 。 设 有 如 下 所 示 
的 C 语言 编写 的 函数 cf211。 
inrt __fastcall cf21K int x int y) /由 寄存 器 传 参 数 
{ 
retum (2+ xt St yt 100) ; 
} 
在 采用 编译 优化 选项 “使 速度 最 大 化 ”的 情况 下 ,编译 上 述 程序 后 ,得 到 如 下 所 示 的 目标 代 
码 , 采 用 汇编 格式 指令 的 形式 表示 。 
;函数 cf211 目标 代码 ( 使 速度 最 大 化 ) 
lea ”eax DWORD PTR [edxtedxet4+100] ;DWORD PIR 表 示 存 储 单元 是 双 字 
lea eax DWORD PTR [eaxtecx*2] 
ret ;返回 到 调用 者 
对 比 源 程序 和 目标 代码 可 知 ,参数 x 被 安排 在 寄存 器 ECX 中 ,参数 y 被 安排 在 寄存 器 
EDX 中 ,最 后 的 返回 值 被 安排 在 寄存 器 EAX 中 。 另 外 ,符号 “DWORD PTR” 表 示 涉 及 的 存储 
器 操作 数 是 双 字 (32 位 ) ,这 里 仅 是 利用 取 有 效 地 址 指令 来 计算 表达 式 ,与 存储 器 操作 数 尺寸 
无 关 。 
修改 函数 cf211 成 如 下 的 函数 cf212。 
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int __fastcall cf2IX int x int y) /由 寄存 器 传 参 数 
{ 
return (3 xt 7 yt 20) ; 
} 
在 采用 编译 优化 选项 “使 速度 最 大 化 ”的 情况 下 ,编译 上 述 程序 后 ,得 到 如 下 所 示 的 目标 代 
码 ,分 号 之 后 是 添加 的 注释 。 


;函数 cf212 目标 代码 ( 使 速度 最 大 化 ) 

lea eax, DNORD PTR [ ecx+ ecxk 了 ; eaxc 3 x 

lea ecx DWRD PTR [edxk 8] ;ecc By 

Sb ecx, edx ;ec Hy 

lea eax, DNORD PTR [eaxt ecxr 200] ; eae 3# x+ 7t yt 20 
ret ;返回 到 调用 者 


同样 ,寄存 器 ECX 存放 参数 x, 寄 存 器 EDX 存放 参数 y, 而 EAX 存放 最 后 的 返回 值 。 


2.6 指令 指针 寄存 器 和 简单 控制 转移 


除了 通用 寄存 器 ,标志 寄存 器 和 段 寄存 器 外 ,IA-32 系列 CPU 还 有 一 个 指令 指针 寄存 器 。 
指令 指针 寄存 器 直接 参与 确定 要 执行 的 指令 。 通 常 一 个 程序 会 含有 分 支 .循环 ,也 会 调用 函 
数 ,程序 流程 在 执行 过 程 中 会 发 生变 化 。 程 序 流程 的 变化 是 由 控制 转移 指令 改变 指令 指针 寄 
存 器 和 代码 段 寄 存 器 CS 实现 的 。 本 节 将 介绍 指令 指针 寄存 器 .条 件 转移 指令 和 简单 的 无 条 
件 转移 指令 ,以 及 比较 指令 。 


2.6.1 指令 指针 寄存 器 


IA-32 系列 CPU 有 一 个 32 位 的 指令 指针 寄存 器 EIP。 在 早先 的 16 位 CPU 中 ,指令 指针 
寄存 器 (Instruction Pointer,IP) 是 16 位 的 。 现 在 的 32 位 指令 指针 寄存 器 EIP 是 早先 16 位 指 
令 指 针 寄 存 器 IP 的 扩展 。 

由 机 器 指令 组 成 的 目标 程序 存放 在 存储 器 中 .CPU 执行 程序 就 是 一 条 接 一 条 地 执行 机 器 
指令 。 可 以 把 CPU 执行 指令 的 过 程 看 作 一 条 处 理 指令 的 流水 线 ,其 第 一 步 是 从 存储 器 中 取 
出 指令 。 为 了 从 存储 器 中 取 指 令 ,必须 形成 存储 单元 的 物理 地 址 。 由 2.4 节 可 知 ,由 于 采用 分 
段 方式 管理 存储 器 ,存储 单元 的 段 号 和 偏 移 就 确定 了 其 物理 地 址 。 

由 CS 和 EIP 确定 所 取 指 令 的 存储 单元 地 址 。 代 码 段 寄存 器 CS 给 出 当前 代码 段 的 段 号 ， 
指令 指针 寄存 器 EIP 给 出 偏 移 。 如 果 根 据 代码 段 寄存 器 CS 得 到 的 代码 段 起 始 地 址 是 0, 那么 
由 EIP 给 出 的 偏 移 或 者 有 效 地 址 ,就 是 所 取 指 令 的 物理 地 址 。 

注意 ,在 实 方式 下 .由 于 段 的 最 大 范围 是 64KB, 因 此 EIP 中 的 高 16 位 必须 是 0 , 仍 相当 于 
只 有 低 16 位 的 IP 起 作用 。 

在 取出 一 条 指令 后 ,会 根据 所 取 指 令 的 长 度 , 自 动 调整 指令 指针 寄存 器 EIP 的 值 ,使 其 指 
向 下 一 条 指令 。 这 样 ,就 实现 了 顺序 执行 指令 。 

如 果 改 变 指令 指针 寄存 器 EIP 的 值 , 则 会 引起 转移 。 控 制 转 移 指 令 就 是 专门 用 于 改变 
EIP 内 容 的 指令 。 控 制 转移 指令 可 分 为 条 件 转移 指令 、 无 条 件 转移 指令 、 循 环 指令 、 函 数 调 用 
及 返回 指令 ,中 断 指令 及 中 断 返回 指令 等 。 各 种 控制 转移 指令 能 够 用 于 根据 不 同 的 情形 改变 
EIP 的 内 容 , 从 而 实现 转移 。 
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2.6.2 常用 条 件 转移 指令 


条 件 转移 指令 是 使 用 得 最 多 的 控制 转移 指令 。 

所 谓 条 件 转移 ,是 指 当 某 一 条 件 满 足 时 ,发 生 转移 ,否则 继续 顺序 执行 。 换 句 话 说, 当 某 一 
条 件 满足 时 ,就 改变 EIP 的 内 容 , 从 而 实施 转移 ,否则 顺序 执行 。 

在 2. 3 节 介 绍 的 标志 寄存 器 中 的 状态 标志 被 用 于 表示 条 件 。 绝 大 部 分 条 件 转移 指令 根据 
某 个 标志 或 者 某 几 个 标志 来 判断 条 件 是 否 满足 。 

1. 应 用 示例 

【 例 2-46】 下 面 的 程序 dp213 中 的 嵌入 汇编 代码 片段 ,实现 了 求 整 型 数组 arri 中 10 个 元 
素 值 的 和 。 


#include < stdio h> /演示 程序 213 
inrt arri[]={2 5 及 到 7 52 1840]: 
int mair() 
{ 
int sum; /用 于 存放 累加 和 
/嵌入 汇编 
_asm{ 
MW EAX 0 /用 于 存放 累加 和 
WW Esl,0 /作为 数组 的 下 标 ( 索引 
MW EX 10 // 作 为 计数 器 
LEA EX arri // 得 到 数组 首 元 素 的 有 效 地 址 
NEXT: 
ADD ”EAX [EBKr ESI*] /累加 某 个 元 素 值 ( 由 索引 确 铸 
IN ESI /调整 下 标 
DEC EX /计数 器 减 Y 该 指令 会 影响 状态 标 动 
JZ ET // 当 EX 不 为 0 时 ,从 NRT 继续 执行 
MV sm EAX /保存 累加 和 
} 
printf” smF % d\n", sun) ; /显示 为 smF 52 
returm 0; 


] 

上 述 嵌 入 汇编 代码 片段 的 主体 是 一 个 循环 。 每 执行 一 次 循环 体 ,就 把 当前 元 素 的 值 加 到 
累加 器 EAX 中 ,然后 调整 作为 索引 (下 标 ) 的 ESI。 由 指令 “DEC ECX” 和 指令 “JNZ 
NEXT” 实 现 循环 控制 。 在 执行 指令 “DEC ECX” 时 ,使 寄存 器 ECX 的 值 减 1, 并 且 如 果 ECX 
的 结果 不 为 0, 零 标志 ZF 为 0, 否 则 ZF 为 1。 在 执行 指令 “JNZ ” NEXT” 时 ,如 果 ZF 为 0( 表 
示 计 数 结果 不 为 0) , 则 从 NEXT 处 继续 执行 ; 如 果 ZF 为 1( 表 示 计 数 结果 为 0) , 则 执行 下 一 
条 指令 (这 里 是 保存 累加 和 的 指令 ) ,于 是 结束 循环 。 

指令 “JNZ NEXT” 就 是 条 件 转移 指令 。 该 指令 根据 零 标 志 ZF 判断 条 件 是 否 满足 。 指 
令 助 记 符 JNZ 的 意思 是 “Jump if not zero”。 当 ZF 为 0 时 ,表示 条 件 满 足 , 发 生 转 移 ; 当 ZF 
为 1 时 ,表示 条 件 不 满足 ,不 发 生 转 移 。 

2. 条 件 转移 指令 的 格式 

条 件 转移 指令 的 一 般 使 用 格式 如 下 : 
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其 中 ,符号 cc 是 代表 各 种 条 件 的 缩写 ,LABEL 代表 源 程 序 中 的 标号 。 当 条 件 满足 时 ,就 
转移 到 标号 LABEL 处 ; 否则 继续 顺序 执行 。 
IA-32 系列 CPU 提供 了 丰富 的 条 件 转移 指令 ,可 用 于 判断 多 种 条 件 。 表 2. 1 列 出 了 各 种 
条 件 转移 指令 。 


表 2.1 条 件 转移 指令 一 览 表 

































































指令 格式 转移 条 件 转移 说 明 其 他 说 明 
JZ 标号 ZF=1 闻 手 中 转移 Wnp if zero) 单个 标志 
JE 标号 | ZF=1 相等 转移 (Jump if equal) 

JNZ 标号 ZF=0 不 等 于 0 轩 吉 (jump if not zero) 单个 标志 
JNE 标号 | ZF=0 不 相等 转移 (Jump if not equal) 

JS 标号 | SF==1 为 负 转 移 (Jump if sign) 单个 标志 
JNS 标号 | SF=0 为 正 转移 (Jump if not sign) 单个 标志 
JO 标号 | OF=1 溢出 转移 (Jump if overflow) 单个 标志 
JNO 标号 | OF=0 不 溢出 转移 (Jump if not overflow) 单个 标志 
亚 标号 PF=1 偶 转移 (Jump 让 Darity) 单个 标志 
JPE 标号 | PF=1 偶 转移 (Jump if parity even) 

JNP 标号 PF=1 奇 转移 (Jump i pot parity) 日 不 标 天 
JPO 标号 | PF=1 奇 转移 (Jump if parity odd) 

JB 标号 | PF=1 低 于 转移 (Jump if below) 单个 标志 
JNAE 标号 | PF=1 不 高 于 等 于 转移 (Jump if not above or equal) | (无 ep 
JC 标号 | PF=1 进位 位 被 置 转移 (Jump if carry) 

JNB 标号 | CF=0 不 低 于 转移 (Jump if not below) 单个 标志 
JAE ”标号 | CF=0 高 于 等 于 转移 (Jump if above or equal) Cs 
JNC 标号 | CF=0 进位 位 被 清 转 移 (Jump if not carry) 

JBE 标号 | CF=1 或 者 ZF=1 低 于 等 于 转移 (Jump if below or equal) 两 个 标志 
JNA ”标号 | CF=1 或 者 ZF=1 不 高 于 转移 (Jump if not above) (无 符号 数 ) 
JNBE 标号 | CF=0 并 且 ZF=0 不 低 于 等 于 转移 (Jump if not below or equal) 两 个 标志 
JA 标号 | CF=0 并 且 ZF=0 高 于 转移 (Jump if above) (无 符号 数 ) 
IL 标号 | SF 了 产 OF 小 于 转移 (Jump if less) 两 个 标志 
JNGE 标号 | SF 产 OF 不 大 于 等 于 转移 (Jump if not greater or equal) | (有 符号 数 ) 
JNL 标号 | SF=OF 不 小 于 转移 (Jump if not less) 两 个 标志 
JGE 标号 | SF=OF 大 于 等 于 转移 (Jump if greater or equal) (有 符号 数 ) 
JLE 标号 | ZF==1 或 者 SF 了 关 OF | 小 于 等 于 转移 (Jump if less or equal) 3 个 标志 
JNG 标号 | ZF==1 或 者 SF 产 OF | 不 大 于 转移 (Jump if not greater) (有 符号 数 ) 
JNLE 标号 | ZF=0 并 且 SF=OF | 不 小 于 等 于 转移 (Jump if not less or equal) 3 个 标志 
JG 标号 | ZF=0 并 且 SF=OF | 大 于 转移 (Jump if greater) (有 符号 数 ) 
JCXZ 标号 | CX=0 计数 器 CX 为 0 转移 与 标志 无 关 
JECXZ 标号 | ECX=0 计数 器 ECX 为 0 转移 与 标志 无 关 


从 表 2. 1 可知 ,有 些 条 件 转 移 指令 根据 一 个 状态 标志 位 判断 条 件 是 否 满足 ,有 些 则 根据 两 
个 状态 标志 或 者 3 个 状态 标志 判断 条 件 是 否 满足 ,只 有 列 在 最 后 的 JCXZ 指令 和 JECXZ 指令 
例外 。 从 表 2. 1 还 可 知 , 有 些 条 件 转移 指令 有 两 个 助 记 符 ,还 有 些 条 件 转移 指令 有 3 个 助 记 
符 。 使 用 多 个 助 记 符 的 目的 是 便于 记忆 和 使 用 ,实际 上 ,判断 的 条 件 在 逻辑 上 是 相同 的 ,对 应 
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的 机 器 指令 只 有 一 条 。 例 如 ,指令 JG 和 指令 JNLE 代表 同一 条 件 转移 指令 ,条 件 “ 大 于 ”和 条 
件 “ 不 小 于 等 于 ”在 逻辑 上 是 一 样 的 。 

【 例 2-47】 把 寄存 器 ECX 中 的 值 视 为 有 符号 数 。 如 下 指令 片段 的 功能 是 : 当 ECX 中 的 
值 为 0 时 ,使 EAX 为 0; 当 ECX 为 正 数 时 ,使 EAX 为 1; 否则 使 EAX 为 一 1。 


SB EX 0 ;不 改变 多 的 值 ,同时 根据 EX 的 值 影响 标志 
MW EAX 0 ; 先 假 设 EX 的 值 为 0 

由 0 ;如 果 下 《表示 确实 为 0 , 则 转移 到 标号 QF 处 
MW EAX 1 再 假设 蛟 的 值 为 正 

JS 0 ;如 果 sS=Q 表示 确实 为 正 ) , 则 转移 

MW EAX -1 ;至 此 ,EX 的 值 为 负 


OVER: 

在 上 述 片段 中 ,利用 指令 “SUB ECX,0” 根 据 ECX 的 值 影响 标志 寄存 器 中 的 状态 标志 ， 
为 随后 的 判断 创造 条 件 。 值 得 指出 ,MOYV 指令 本 身 并 不 会 改变 状态 标志 。 

3. 说 明 

条 件 转移 指令 本 身 不 影响 标志 。 

条 件 转移 指令 在 条 件 满足 的 情况 下 ,只 改变 指令 指针 寄存 器 EIP。 也 就 是 说 ,条 件 转移 的 
转移 目的 地 仅 限 于 同一 个 代码 段 内 。 这 种 不 改变 代码 段 寄存 器 CS, 仅 改变 EIP 的 转移 称 为 段 
内 转移 。 

条 件 转移 指令 可 以 实现 向 前 方 转移 ,也 可 以 实现 向 后 方 转移 。 对 例 2-46 而 言 , 标 号 
NEXT 在 后 方 (过 往 ); 对 例 2-47 而 言 ,标号 OVER 在 前 方 (未 来 ) 。 

在 3. 3. 2 节 中 将 进一步 介绍 条 件 转移 指令 。 


2.6.3 比较 指令 和 数值 大 小 比较 


如 2. 6.2 节 所 述 , 绝 大 部 分 条 件 转移 指令 根据 标志 寄存 器 中 的 有 关 状 态 标 志 来 判断 条 件 
是 否 满足 。 在 例 2-46 中 ,指令 “JNZ NEXT” 根 据 零 标志 ZF 判断 条 件 是 否 满足 ,实际 上 ,其 
上 一 条 指令 “DEC ECX"” 已 根据 计数 值 影响 了 ZF 标志 。 在 例 2-47 中 ,通过 指令 “SUB 
ECX,0” 影 响 各 状态 标志 。 为 了 比较 两 个 数 的 大 小 ,可 以 利用 指令 SUB 根据 这 两 个 数 的 差 来 
影响 标志 。 但 是 ,指令 SUB 会 把 差 保存 到 目的 操作 数 中 ,也 就 是 说 会 改变 目的 操作 数 。 当 然 ， 
如 果 作 为 源 操作 数 的 减 数 为 0 时 ,目的 操作 数 保持 不 变 , 这 仅 是 特例 。 
为 了 既 能 够 根据 两 个 数 的 差 影 响 各 状态 标志 ,又 能 不 改变 两 个 操作 数 的 原 值 ,IA-32 系列 
CPU 提供 了 专门 的 比较 指令 CMP。 
1. 比较 指令 CMP 
比较 指令 的 格式 如 下 : 
OP L057 Sm 
这 条 指令 根据 DEST-SRC 的 差 来 影响 标志 寄存 器 中 的 各 状态 标志 ,但 不 把 作为 结果 的 差 
送 到 目的 操作 数 DEST。 
除了 不 把 结果 送 到 目的 操作 数 外 ,这 条 指令 与 SUB 指令 一 样 。 
【 例 2-48〗 如 下 指令 演示 比较 指令 CMP 的 使 用 。 
QP EX -2 ;把 色 与 -2 比较 
OP Esl, EX :把 BI 与 国 比 较 
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QP AL [ESD :把 儿 与 BI 所 指 的 字 节 存储 单元 值 作 比 较 
OP [EX DI*45, 区 ;把 由 Bt+ 印 上 445 所 指 字 存 储 单元 值 与 以 作 比 较 
2. 比较 数值 大 小 


为 了 比较 两 个 数值 的 大 小 ,一般 使 用 比较 指令 。 在 比较 指令 之 后 ,可 根据 零 标志 ZF 是 否 
置 位 ,判断 两 者 是 否 相 等 ; 如 果 两 者 是 无 符号 数 , 则 可 根据 进位 标志 CF 判断 大 小 ; 如 果 两 者 
是 有 符号 数 , 则 要 同时 根据 符号 标志 SF 和 溢出 标志 OF 判断 大 小 。 

为 了 方便 进行 数值 大 小 比较 ,如 表 2. 1 所 示 ,IA-32 系列 CPU 提供 了 两 套 以 数值 大 小 为 
条 件 的 条 件 转移 指令 ,一 套 适 用 于 无 符号 数 之 间 的 比较 , 另 一 套 适 用 于 有 符号 数 之 间 的 比较 。 
这 两 套 条 件 转移 指令 判断 的 标志 是 不 同 的 。 为 了 便于 区 分 ,有 符号 数 间 的 次 序 关系 称 为 大 于 
(G) ,等 于 (E) 或 小 于 (L); 无 符号 数 间 的 次 序 关 系 称 为 高 于 (A) .等 于 (E) 或 低 于 (B)。 在 使 用 
时 要 注意 区 分 它们 ,不 能 混淆 。 

【 例 2-49】 设 ECX 和 EDX 含有 两 个 数 , 现 要 求 把 较 大 者 保存 在 ECX 中 , 较 小 者 保存 在 


EDX 中 。 

如 果 这 两 个 数 是 有 符号 数 , 则 代码 片段 如 下 : 
QP EX EX 
JE Kk 光 符 号 数 比较 大 小 转移 ( 判断 S 和 OF) 
XCHG EX, EX 

CK: 

如 果 这 两 个 数 是 无 符号 数 , 则 代码 片段 如 下 : 
OP EX EX 
HE Kk :无 符号 数 比较 大 小 转移 ( 判断 0F) 
XH EX EX 

Kk: 


下 面 通过 高 级 语言 源 程序 的 目标 代码 来 进一步 说 明 比 较 指 令 和 条 件 转 移 指 令 的 运用 。 
【 例 2-50〗 设 有 如 下 所 示 的 C 语言 编写 的 函数 cf214。 
int _fastcall cf214 int x int y) /寄存 器 传递 参数 
{ 

irt 元 1; 

if x>= 13 8& y <= 2) 

2; 

return Zz; 

} 


在 采用 编译 优化 选项 “使 速度 最 大 化 ”的 情况 下 .编译 上 述 程序 后 ,可 得 到 如 下 所 示 的 目标 
代码 ,其 中 标号 稍 有 改变 ,分 号 之 后 是 添加 的 注释 。 


;函数 cf24 目标 代码 ( 使 速度 最 大 仙 
mv eax 1 

ap ecx 13 交 与 /个 帮 较 
jl SHRT LNicf214 ;小 于 , 则 转移 
ap ek2B y 与 加 比较 
jg SHORT LNicf214 ;大 于 , 则 转移 
mov eax2 


LNicf214: 





ret ;返回 到 调用 者 

在 上 述 汇编 格式 的 目标 代码 中 ,符号 “SHORT” 表 示 转 移 目 的 地 就 在 附近 。 

对 照 函数 cf214 的 源 代码 可 知 ,参数 xz 被 安排 在 寄存 器 ECX 中 ,参数 y 被 安排 在 寄存 器 
EDX 中 ,最 后 的 返回 值 被 安排 在 寄存 器 EAX 中 。 在 上 述 函 数 cf214 的 目标 代码 中 ,采用 了 条 
件 转移 指令 “jl SHORT LN1cf214”, 当 参数 zx 小 于 13 时 ,使 流程 跳 转 到 标号 LNlcf214 处 ， 
也 就 是 跳 转 到 下 一 条 语句 的 开始 处 。 采 用 了 条 件 转移 指令 “jg SHORT LNlcf214”, 当 参数 
y 大 于 28 时 ,使 流程 跳 转 到 标号 LNlcf214 处 。 


2.6.4 简单 的 无 条 件 转移 指令 


无 条 件 转移 指令 是 另 一 种 控制 转移 指令 。 

这 里 仅 介绍 无 条 件 段 内 直接 转移 指令 , 它 是 最 简单 的 无 条 件 转移 指令 。 在 3. 3. 2 节 中 将 
进一步 介绍 无 条 件 转移 指令 。 

1. 无 条 件 段 内 直接 转移 指令 的 格式 

无 条 件 段 内 直接 转移 指令 的 使 用 格式 如 下 ,其 中 ,LABEL 代表 源 程序 中 的 标号 。 

Jp WH 

这 条 指令 使 控制 无 条 件 地 转移 到 标号 LABEL 位 置 处 。 所 谓 无 条 件 , 是 指 没 有 任何 前 提 
条 件 , 必 定 实施 转移 。 类 似 于 C 语言 中 的 goto 语句 。 

无 条 件 转 移 指令 本 身 不 影响 标志 。 

【 例 2-51】 把 寄存 器 ECX 中 的 值 视 为 无 符号 数 。 如 下 指令 片段 的 功能 是 : 当 ECX 中 的 
值 大 于 等 于 3 时 ,使 EAX 为 5; 否则 使 EAX 为 7。 


QP EX 3 ;比较 EX 和 3 
JE UBl ;如 EX>= 3, 转 移 到 标号 NB 处 
WwW EAX 7 :否则 ,EOE7 
JP UB ;无 条 件 转移 到 UB2 处 
LAB1: 
MV EAX 5 
LAB2: 
从 效率 上 看 ,这 样 的 代码 片段 并 不 好 ,但 从 可 读 性 看 ,还 是 比较 好 的 。 
2. 应 用 示例 
【 例 2-52】 分 析 如 下 所 示 C 语言 编写 的 函数 cf215 的 目标 代码 。 
int _fastcall cf2& int x int y) /寄存 器 传递 参数 
{ 
int 2z; 
if x> 10) // 语 句 A 
三 x+ yt7; 
else 
三 2 xt Fy- 12:; 
if y<= 2) // 语 句 B 
三 条 zt3; 


retum Zz; /请 句 C 
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在 采用 编译 优化 选项 “使 速度 最 大 化 ”的 情况 下 ,编译 上 述 程序 后 ,可 得 到 如 下 所 示 的 目标 
代码 ,其 中 标号 稍 有 改变 。 按 照 调 用 约定 ,采用 寄存 器 传递 参数 ,参数 zx 被 安排 在 寄存 器 ECX 
中 ,参数 y 被 安排 在 寄存 器 EDX 中 。 





;函数 cf215 目标 代码 ( 使 速度 最 大 化 ) 
ap ecx, 10 xx 与 人 比较 
jle ”SHORT LN3cf215 ; 当 小 于 等 于 10 时 转 
lea 。 eax DWORD PTR [ecxr ecx+ J] ;计算 表达 式 3k xt 人 y+7 
lea eax, DIORD PTR [eaxt edxek 4 本 
jm SHRT LNcf215 ;无 条 件 转 ( if- else 请 句 结束 ) 
LN3cf215: 
lea eax, DWORD PTR [edek 8] ;计算 表达 式 六 yt x 介 
sub eax edx 
lea eax DIORD PTR [eaxt ecx+ 2- 僻 
LN2cf215: 
ap 。 edx 20 ;yy 与 力 比 较 
jg SHORT LNlcf215 ; 当 大 于 wD 时 转 
lea eax, DWORD PTR [eaxt 4+ 相 ;计算 zt3 
LNicf215: 
ret ;函数 cf 结束 返回 


对 照 函 数 cf215 的 源 程 序 可 知 ,在 上 述 目 标 代码 中 ,采用 了 无 条 件 转 移 指令 “jmp 
SHORT LN2cf215”, 使 流程 跳 转 到 标号 LN2cf215 处 , 即 跳 转 到 下 一 条 语句 的 开始 处 。 在 上 
述 目标 代码 中 ,还 在 男 外 两 个 地 方 使 用 了 条 件 转移 指令 实现 分 支 。 

在 上 述 汇编 格式 的 目标 代码 中 ,符号 *SHORT” 表 示 转 移 目 标 地 就 在 附近 ,符号 “DWORD 
PTR” 表 示 涉 及 的 存储 器 操作 数 是 双 字 (32 位 操作 数 ) ,这 里 仅 是 利用 取 有 效 地 址 指令 lea 计算 
表达 式 的 值 , 实 际 上 与 存储 单元 无 关 。 


2.7 堆栈 和 堆栈 操作 


程序 的 运行 与 堆栈 有 密切 关系 。CPU 在 运行 程序 期 间 往 往 需要 利用 堆栈 保存 某 些 关键 
信息 ,程序 自身 也 经 常会 利用 堆栈 临时 保存 一 些 信 息 。 本 节 介 绍 堆栈 的 概念 和 常用 的 堆栈 操 
作 指 令 。 在 高 级 语言 中 , 堆 和 栈 是 两 个 不 同 的 概念 ,这 里 介绍 的 堆栈 对 应 高 级 语言 的 栈 。 


2.7.1 堆栈 


堆栈 ( 栈 ) 就 是 一 段 内 存 区 域 ,只 是 对 它 的 访问 操作 仅 限 于 一 端 进行 。 地 址 较 大 的 一 端 称 
为 栈 底 ,地址 较 小 的 一 端 称 为 栈 项 。 堆 栈 操 作 遵守 * 后 进 先 出 ”的 原则 ,所 有 数据 的 存 人 和 取出 
都 在 栈 顶 进行 。 把 存 人 数据 的 操作 称 为 进 栈 操作 ,把 取出 数据 的 操作 称 为 出 栈 操作 。 进 栈 操 
作 也 称 为 压 栈 操作 ,出 栈 操作 也 称 为 弹出 操作 。 

用 于 堆栈 的 内 存 区 域 在 什么 位 置 ? 堆栈 的 栈 顶 在 哪里 ? 堆栈 段 寄存 器 SS 含有 当前 堆栈 
段 的 段 号 ,也 就 是 说 ,SS 指示 堆栈 所 在 内 存 区 域 的 位 置 。 堆 栈 指针 寄存 器 ESP 含有 栈 顶 的 偏 
移 ( 有 效 地 址 ) ,也 就 是 说 ,ESP 指向 栈 顶 。 

图 2. 9 给 出 了 堆栈 和 堆栈 操作 示意 图 。 堆 栈 的 栈 顶 由 SS 和 ESP 确定 。 随 着 进 栈 操作 ， 
ESP 减 小 ,指向 地 址 更 低 的 存储 单元 ; 随 着 出 栈 操 作 , ESP 增 大 ,指向 地 址 更 高 的 存储 单元 。 
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程序 员 一 定 要 充分 注意 堆栈 的 平衡 。 


堆栈 底部 堆栈 底部 堆栈 底部 


ESP 一 
ESP 














SS SS 8 -一 
(a) 堆栈 初始 情形 (b) 进 栈 后 的 情形 (c) 部 分 出 栈 后 的 情形 
2.9 堆栈 和 堆栈 操作 示意 图 


如 果 需 要 ,通过 重新 设置 SS 和 ESP, 就 可 以 改变 堆栈 的 位 置 和 栈 顶 的 位 置 。 

在 实 方式 下 ,由 于 每 个 段 的 长 度 不 超过 64KB, 因 此 在 堆栈 操作 时 ,以 堆栈 指针 寄存 器 
ESP 的 低 16 位 SP 作为 堆栈 指针 。 

堆栈 主要 用 途 有 以 下 几 方 面 ,在 以 后 的 章节 中 将 介绍 这 些 用 途 的 具体 使 用 。 

(1) 保护 寄存 器 内 容 或 者 保护 现场 。 

(2) 保存 返回 地 址 。 

(3) 传递 参数 。 

(4) 安排 局 部 变量 或 者 临时 变量 。 


2.7.2 堆栈 操作 指令 


如 上 所 述 ,堆栈 操作 分 为 进 栈 和 出 栈 , 堆 栈 操作 指令 也 分 为 进 栈 指 令 和 出 栈 指令 。 

可 以 认为 堆栈 操作 指令 属于 传送 指令 。 这 里 所 介绍 的 堆栈 操作 指令 都 不 影响 状态 标志 。 

1. 进 栈 指令 

进 栈 指令 PUSH 的 一 般 格式 如 下 : 

RH Sm 

该 指令 把 源 操作 数 SRC 压 人 堆栈 。 源 操作 数 SRC 可 以 是 32 位 通用 寄存 器 、16 位 通用 寄 
存 器 和 段 寄 存 器 ,也 可 以 是 双 字 存 储 单元 或 者 字 存储 单元 ,还 可 以 是 立即 数 。 

【 例 2-53】 如 下 指令 演示 进 栈 指令 PUSH 的 使 用 ,其 中 符号 “DWORD PTR” 和 “WORD 
PTR” 分 别 表示 为 双 字 存储 单元 (32 位 ) 和 字 存 储 单元 (16 位 )。 


PUSH EX ;把 蚊 的 内 容 压 人 堆栈 

PUSH DWORD PTR [ED 把 蚊 指 示 的 双 字 存 储 单 元 的 内 容 压 人 堆栈 
PUSH EX ;把 芍 的 内 容 压 入 堆栈 

PUSH WORD PTR [EDX] ;把 指示 的 字 存 储 单元 的 内 容 压 人 堆栈 


当 进 栈 指令 PUSH 在 把 一 个 双 字 数据 (如 32 位 通用 寄存 器 ,又 如 双 字 存储 单元 ) 压 和 人 堆 
栈 时 , 先 把 ESP 减 4, 然 后 再 把 双 字 数据 送 到 ESP 所 指示 的 存储 单元 。 在 把 一 个 字数 据 ( 如 16 
位 通用 寄存 器 、 字 存储 单元 ) 压 入 堆栈 时 , 先 把 ESP 减 2, 青 把 字数 据 送 到 ESP 所 指示 的 存储 
单元 。 这 样 ,ESP 总 是 指向 栈 顶 。 

【 例 2-54】〗 设 堆栈 操作 之 初 的 ESP 为 0013FA74H ,执行 如 下 指令 片段 时 ,堆栈 变化 如 
图 2. 10 所 示 。 
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WW EMX 123468H 
PUSH EAX ;ESP= OO{FAMH 
PSH 以 ;ESP= OFAMEH 


为 了 节省 篇 幅 , 图 2. 10 中 每 一 格 代表 一 个 字 存 储 单元 (两 个 字 节 ) 。 























ESp--ISS 0013FA74 SS 0013FA74 
0013FA72 
5678 
5078 | 0013FA70 
ESP 一 | 0013FA6E 
00000000 00000000 
(a) 堆栈 初始 情形 (b) 进 栈 后 的 情形 


2. 10 堆栈 操作 示意 图 


从 Intel 80386 开始 ,被 压 人 堆栈 的 立即 数 不 仅 可 以 是 字 ,还 可 以 是 双 字 。 

【 例 2-55】 假设 ESP 的 初 值 为 003EFC5CH。 如 下 指令 片段 演示 进 栈 指令 把 立即 数 床 人 
堆栈 ,其 中 “WORD PTR” 表 示 16 位 数据 ,“DWORD PTR” 表 示 32 位 数据 ,注释 部 分 给 出 
了 进 栈 操作 后 ESP 的 值 。 


PUSH WORD PTR 4455H :ESP= OOGEFCSH, 16 位 数据 入 栈 
PUSH WORD PTR 11H ;ESP= 009FF058H, 16 位 数据 入 栈 
PUSH DWORD PTR 2 ;ESP= 009F054, 2 位 数据 入 栈 
PUSH 66778999H ;ESP= OOGEFC50H, 22 位 数据 入 栈 
进 栈 指令 PUSH 至 少 把 一 个 字 (16 位 ) 的 数据 压 和 人 堆栈 。 
2. 出 栈 指 令 
出 栈 指 令 POP 的 一 般 格 式 如 下 : 
PP D057 


该 指令 从 栈 顶 弹出 一 个 双 字 或 者 字数 据 到 目的 操作 数 DEST。 目 的 操作 数 可 以 是 32 位 
通用 寄存 器 、16 位 通用 寄存 器 和 段 寄 存 器 ,也 可 以 是 双 字 存储 单元 或 者 字 存储 单元 。 如 果 目 
的 操作 数 是 双 字 的 ,那么 就 从 栈 顶 弹出 一 个 双 字 数据 ; 否则 ,从 栈 顶 弹出 一 个 字数 据 。 出 栈 指 
令 至 少 弹出 一 个 字 (16 位 ) 。 

注意 ,出 栈 指 令 的 操作 数 不 能 是 立即 数 ,也 不 能 是 代码 段 寄 存 器 CS。 

【 例 2-56】 如 下 指令 演示 出 栈 指 令 POP 的 使 用 ,其 中 符号 “DWORD PTR” 和 “WORD 
PTR” 分 别 表示 为 双 字 存储 单元 和 字 存 储 单元 。 


POP EsI ;从 堆栈 弹出 一 个 双 字 到 EI 

POP 。 DWRD PTR [EBX+ ;从 堆栈 弹出 一 个 双 字 到 EBX+ 4 所 指示 的 存储 单元 
PP ol ;从 堆栈 弹出 一 个 字 到 DI 

POP ”WORD PTR [EDXr 引 ;从 堆栈 弹出 一 个 字 到 Er 8 所 指示 的 存储 单元 


当 出 栈 指令 POP 在 从 栈 顶 弹出 一 个 双 字 数据 时 , 先 从 ESP 所 指示 的 存储 单元 中 取出 一 
个 双 字 送 到 目的 操作 数 ( 如 32 位 通用 寄存 器 、 双 字 存 储 单元 ) ,然后 把 ESP 加 4。 在 从 栈 顶 弹 
出 一 个 字数 据 时 , 先 从 ESP 所 指示 的 存储 单元 中 取出 一 个 字 送 到 目的 操作 数 ( 如 16 位 通用 寄 
存 器 、 字 存储 单元 ) ,然后 把 ESP 加 2。 这 样 ,确保 ESP 总 是 指向 栈 顶 。 


新 概念 汇编 语言 





【 例 2-57〗 如 下 C 程序 dp216 及 其 嵌入 汇编 代码 片段 ,演示 堆栈 操作 和 堆栈 指针 寄存 器 
变化 。 在 嵌入 汇编 代码 片段 中 : 每 次 堆栈 操作 后 ,把 当前 堆栈 指针 寄存 器 ESP 的 值 保 存 到 一 
个 变量 中 ; 先 把 一 个 双 字 (32 位 ) 压 入 堆栈 ,再 压 一 个 字 (16 位 ) 到 堆栈 ,然后 从 堆栈 弹出 一 个 
双 字 ,再 弹出 一 个 字 。 通 过 观察 各 阶段 ESP 的 值 . 了 解 堆栈 指针 变化 的 情况 。 通 过 观察 压 人 
和 弹出 堆栈 的 值 , 了 解 堆栈 操作 的 “先进 后 出 ”。 

#include < stdio.h> 


{ 


/演示 程序 dp216 


int mair() 
int varspl, varsp2 varsp3, varsp4 varsp5; /用 于 存放 EP 值 
int varr1，varr2; /用 于 存放 虹 值 
// 占 入 汇编 
_asm{ 
MV ”EAX 12345678H // 初 值 
MN varspl, ESP // 保 存 演示 之 初 的 ER 假设 为 FA741) 
PusH EX /把 羽 压 人 堆栈 
MN varsp2 ESP /保存 当前 ER O0ITA7H) 
PUSH 以 /把 以 压 入 堆栈 
MOV varsp3, ESP /保存 当前 ER ONKEH) 
POP EX /从 堆栈 弹出 双 字 到 本 
MV varsp4 ESP /保存 当前 ER O01FFA72) 
MY varrl, EX 
POP Bx /从 堆栈 弹出 字 到 以 
MY varsp5, ESP /保存 当前 ESR O01FFA741) 
MY varr2 EX 
} 
printf ”ESP 人 = % O84N\n" ,varsp1) ; /显示 为 ESPt= O01FFA74H 
printK ”ESP2= % (BN\n" ,varsp2) ; /显示 为 EPZ= O01FAMH 
printf ”ESP3=% (BN\n" ,varsp3) ; /显示 为 ESP3= O01FAMEH 
printk" ESP4=% (84N\n" ,varsp4) ; /显示 为 ESP4- O01FA7H 
printk" ESP5=% (B84\n" ,varsp5) ; /显示 为 ESP5= O01FA7H 
printf" EEXf=% O84N\n" ,varr1) ; /显示 为 EXF 56785678H 
printK”EBX=% (BN\n" ,varr2) ; /显示 为 BC- 5081234 
return 0; 


] 


在 上 述 的 嵌入 汇编 代码 片段 中 ,假设 在 堆栈 操作 之 初 的 ESP 为 0013FA74 理 ,那么 堆栈 操 
作 前 后 的 堆栈 情况 如 图 2. 10 所 示 。 需 要 特别 说 明 : 在 上 述 的 嵌入 汇编 代码 中 , 先 压 人 一 个 双 
字 , 再 压 人 一 个 字 , 然 后 先 弹出 一 个 双 字 ,再 弹出 一 个 字 ,正常 情况 下 不 应 该 这 样 做 。 这 里 这 样 
安排 ,完全 是 为 了 充分 演示 堆栈 操作 的 特点 。 

【 例 2-58】 如 下 的 程序 片段 说 明 堆 栈 的 一 种 用 途 ,临时 保存 寄存 器 的 内 容 。 


RSH EP 
PUSH ESI 


;保护 EP 
;保护 EI 
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PUSH EI ;保护 印 | 

世 ;其 他 操作 

;假设 其 间 会 破坏 BP、BI 和 男 | 的 原 有 值 
POP Bl 和 恢复 印 | 

POP EI 和 恢复 EI 

PP 。” 钳 恢复 印 


在 利用 堆栈 临时 保护 寄存 器 内 容 时 ,必须 充分 注意 堆栈 操作 的 “后 进 先 出 原则。 同时 还 
要 充分 注意 保证 堆栈 的 平衡 。 

3. 通用 寄存 器 全 进 栈 指令 和 全 出 栈 指令 

有 时 需要 把 多 个 通用 寄存 器 压 和 堆栈 ,以 保护 这 些 通用 寄存 器 中 的 值 。 为 了 提高 程序 的 
空间 效率 ,IA-32 系列 CPU 提供 了 通用 寄存 器 全 进 栈 指 令 和 全 出 栈 指令 。 

(1) 16 位 通用 寄存 器 全 进 栈 指 令 (PUSHA) 和 全 出 栈 指令 (POPA)。PUSHA 指令 和 
POPA 指令 提供 了 压 人 或 弹出 8 个 16 位 通用 寄存 器 的 有 效 手 段 ,它们 的 一 般 格式 如 下 : 

RUSMA 
PPA 

PUSHA 指令 将 所 有 8 个 16 位 通用 寄存 器 的 内 容 压 和 人 堆栈 , 压 入 顺序 为 AX、CX、DX、 
BX.SP.BP、SI.DI, 然 后 堆栈 指针 寄存 器 SP 的 值 减 16 ,所 以 SP 进 栈 的 内 容 是 PUSHA 执行 
之 前 的 值 。 

POPA 指令 从 堆栈 弹出 内 容 , 以 PUSHA 相反 的 顺序 送 到 这 些 通用 寄存 器 ,从 而 恢复 
PUSHA 之 前 的 寄存 器 内 容 。 但 SP 的 值 不 是 由 堆栈 弹出 的 ,而 是 通过 增加 16 来 恢复 。 

(2) 32 位 通用 寄存 器 全 进 栈 指 令 (PUSHAD) 和 全 出 栈 指令 (POPAD)。PUSHAD 指令 
和 POPAD 指令 提供 了 压 入 或 弹出 8 个 32 位 通用 寄存 器 的 有 效 手段 ,它们 是 PUSHA 和 
POPA 指令 的 扩展 。 一 般 格式 如 下 : 

PUSHD 
POPD 

PUSHAD 指令 将 所 有 8 个 32 位 通用 寄存 器 的 内 容 压 人 堆栈 , 压 入 顺序 为 EAX、ECX、 
EDX、EBX、ESP、EBP、ESI、EDI, 然 后 堆栈 指针 寄存 器 ESP 的 值 减 32, 所 以 ESP 进 栈 的 内 容 
是 PUSHAD 执行 之 前 的 值 。 

POPAD 指令 从 堆栈 弹出 内 容 ,以 PUSHAD 相反 的 顺序 送 到 这 些 通用 寄存 器 ,从 而 恢复 
PUSHAD 之 前 的 寄存 器 内 容 。 但 堆栈 指针 寄存 器 ESP 的 值 不 是 由 堆栈 弹出 的 ,而 是 通过 增 
加 32 来 恢复 。 

这 4 条 指令 都 没有 显 式 的 操作 数 。 这 些 指 令 也 不 影响 标志 。 

【 例 2-59】 如 下 C 程序 dp217 及 其 嵌入 汇编 代码 ,演示 PUSHAD 指令 的 执行 效果 ,同时 
还 演示 另 一 种 访问 堆栈 区 域 存储 单元 的 方法 。 


#include < stdioh> /演示 程序 217 
int buff[L8] ; /全 局 数组 ,存放 从 堆栈 中 取出 的 各 寄存 器 的 值 
int mair() 
{ 
_asmf 1/ 嵌入 汇编 


RsH EP // 先 保存 外 


举 
前 
从 
靖 
诊 
请 
叫 





WW EAX 0 /给 各 通用 寄存 器 赋 一 个 特定 的 值 
WwW EX1 
WW EX2 
WW EX3 
人 // 决 不 能 随意 改变 EP 
WW Ep,5 
MV ESl,6 
WW El,7 
PUSHAD /把 8 个 通用 寄存 器 的 值 全 部 推 到 堆栈 
WW Ep, EP /使 得 晤 也 指向 堆栈 顶 
LEA ERX buff /把 数组 buff 首 元 素 的 有 效 地 址 送 到 EBX 
WW EX 0 1/ 设置 计数 器 ( 下 标 ) 初 值 
NEXT: 
MV ”EAX [EEP+ ECX+ /依次 从 堆栈 中 取 值 
MN [EBX+ EKt 查 , EX /依次 保存 到 数组 buff 
IN Ex 1 计数 器 加 1 
QP EX8 /是 否 满 8 个 
JZ NET /没有 满 8 个 ,继续 处 理 下 一 个 
POPAD /恢复 8 个 通用 寄存 器 
POP EP /恢复 开始 保存 的 国 


} 
/依次 显示 数组 buff 各 元 素 的 值 ,从 中 观察 FAHAD 指令 压 栈 的 效果 
int ji 
for i=0; i< 8; i+}) 
printf" buff[% d]=%An" , i, buff[); 
retun 0; 
] 
上 述 程 序 运行 后 ,屏幕 显示 输出 “7,6,5,X,1,3,2,0,”。 其 中 ,记号 X 是 与 运行 时 有 关 的 
不 固定 值 。 从 嵌入 汇编 代码 开始 时 对 通用 寄存 器 赋值 的 情形 可 知 ,这 是 由 PUSHAD 指令 压 
到 堆栈 中 的 8 个 32 位 通用 寄存 器 的 值 ,记号 X 处 是 堆栈 指针 寄存 器 的 值 。 虽 然 显示 顺序 与 
压 到 堆栈 中 的 顺序 相反 ,但 同样 可 以 据 此 观察 到 PUSHAD 指令 把 8 个 通用 寄存 器 压 到 堆栈 
中 的 顺序 。 图 2. 11(a) 列 出 了 指令 PUSHAD 把 8 个 通用 寄存 器 压 到 堆栈 中 的 顺序 。 注 意 ,在 
底部 的 EBP 是 在 PUSHAD 指令 之 前 被 压 到 堆栈 中 的 。 
在 上 述 嵌入 汇编 代码 中 ,有 一 个 循环 。 寄 存 器 ECX 作为 计数 器 ,控制 循环 8 次 。 每 次 顺 
序 从 堆栈 中 取出 一 个 值 , 并 保存 到 全 局 数组 buff 的 对 应 元 素 中 ,如 图 2. 11 所 示 , 为 了 节省 篇 
幅 , 每 一 格 是 双 字 (4 个 字 节 )。 在 这 个 循环 中 有 以 下 两 条 关键 指令 。 
WW EMX [EBP+ EC // 第 一 条 指令 ( 从 堆栈 中 取 ) 
MV [EBX+ ECX+4], EX /第 二 条 指令 ( 存放 到 ) 
第 一 条 指令 ,从 堆栈 中 取 数 据 。 在 循环 之 前 ,已 经 把 堆栈 指针 寄存 器 ESP 送 到 EBP, 这 样 
EBP 也 指向 了 栈 项 。 于 是 ,EBP 十 ECX * 4 所 表示 的 有 效 地 址 就 是 位 于 堆栈 中 的 对 应 存储 单 
元 的 有 效 地 址 。 因 为 在 32 位 存储 器 寻 址 方式 中 , 当 EBP 作为 基 址 寄存 器 时 ,那么 默认 引用 的 
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MA 
EBP 
EBP+28 = | EAX |=— EBX+28 
EBP+24 一 一 ECX [=— EBX+24 
EBP+120—™| EDX 上- 一 EBX+20 
EBP+16 一 一 EBX 上 > 上 -一 EBX+16 
EBP+12 一 一 ESP |=— EBX+12 
EBP+8 —™| EBP 上- 一 EBX+8 
EBP+4 一 | ESI 上 -一 EBX+4 
EBP ”一 ”EDL | 一 ESP bu 人 ff 一 一 | | 一 一 EBX 
(a) 堆栈 情形 (b) 数组 buff 


2.11 例 2-59 的 堆栈 和 数组 元 素 对 应 关系 


段 寄存 器 是 SS, 也 就 是 说 对 应 的 存储 单元 位 于 堆栈 。 

第 二 条 指令 ,依次 把 数据 存放 到 数组 buff 中 。 在 循环 之 前 ,利用 取 有 效 地 址 指令 LEA 已 
经 把 数组 buff 首 元 素 的 有 效 地 址 送 到 EBX 中 。 于 是 ,EBX 十 ECX*4 所 表示 的 有 效 地 址 ,是 
数组 buff 中 对 应 元 素 存储 单元 的 有 效 地 址 。 默 认 引用 的 段 寄 存 器 是 DS。 

为 了 简化 演示 程序 ,刻意 把 数组 buff 安排 为 全 局 变量 。 

在 上 述 dp217 的 嵌入 汇编 代码 的 开始 处 先 把 寄存 器 EBP 的 内 容 压 和 人 堆栈 保存 ,在 嵌入 汇 
编 代码 结束 处 从 堆栈 弹出 早先 压 人 的 EBP 内 容 , 从 而 恢复 EBP。 这 是 因为 在 嵌入 代码 片段 
中 ,用 到 了 寄存 器 EBP, 而 EBP 中 又 含有 重要 的 数据 。 


习 题 


1. 利用 网 络 查阅 相关 资料 , 简 述 IA-32 系列 CPU 的 发 展 历史 ,并 列举 最 新 的 几 款 CPU 。 
2. IA-32 系列 CPU 有 哪 几 种 工作 方式 ? 并 简 述 这 些 工作 方式 各 自 的 特点 和 这 些 工作 方 
式 之 间 切 换 的 关键 条 件 。 
3. 说 明 IA-32 系列 CPU 的 通用 寄存 器 命名 规律 。 并 列 出 这 些 通用 寄存 器 的 名 称 。 
. 通用 寄存 器 的 通用 性 表现 在 何 处 ? 这 些 通 用 寄存 器 各 自 有 何 专 门 的 用 途 ? 
. 可 独立 访问 的 通用 寄存 器 有 多 少 个 ?为 什么 可 以 独立 访问 它们 ? 
6. 简要 说 明 寄存 器 EAX 与 寄存 器 AX、AH 和 AL 的 关系 。 并 写 出 如 下 程序 片段 中 每 条 
指令 执行 后 寄存 器 EAX 的 内 容 。 
EAX BBCH 
人 以 1234H 
人 L 98H 
用 码 
AL 8IH 
A 3H 
LM 
用 几 
以 OH 
AM OFFH 


Cn 心 


BESSSE 





SB EM 54 


7. CPU 内 的 通用 寄存 器 是 否 越 多 越 好 ? 通用 寄存 器 不 够 用 怎么 办 ? 
8. 请 比较 分 析 下 面 两 个 指令 片段 的 差异 。 


AD 从 2 INC MX 
INC MX 


9. 标志 寄存 器 中 有 哪些 状态 标志 ? 这 些 状态 标志 的 主要 作用 是 什么 ? 


10. 


写 出 如 下 程序 片段 中 每 条 算术 运算 指令 执行 后 标志 CF、ZF、SF、OF、PF 和 AF 的 


A BH 
ALA 
AL mH 
人 L (BH 
儿 L 作 
A 
A 
A 


BiBSSESE 


. 列举 标志 CF 的 主要 用 途 。 并 至 少 给 出 使 标志 CF 清 0 的 3 种 方法 。 

.结合 指令 “ADD AL, BL” 说 明 标志 CF 和 标志 OF 的 差异 。 

. 说 明 CPU 地 址 线 数量 与 物理 地 址 空间 规模 的 关系 。 

. 存储 单元 的 逻辑 地 址 如 何 表示 ?请 说 明 物 理 地 址 、 段 起 始 地 址 和 有 效 地 址 这 三 者 的 


. IA-32 系列 CPU 有 哪 几 个 段 寄存 器 ? 这 些 段 寄存 器 的 作用 是 什么 ? 
. 常用 的 寻 址 方式 有 哪 几 类 ? 存储 器 寻 址 方式 又 可 分 为 哪 几 种 ? 
. 简要 说 明 如 下 指令 中 源 操作 数 的 寻 址 方式 ,并 相互 比较 。 


WwW EX LI234 
WwW EX 1234 

WwW EX EX 

WW EX [EX 

MWY EX [EBX+ 1234 


.请 写 出 32 位 存储 器 寻 址 方式 的 通用 形式 。 
. 简要 说 明 32 位 存储 器 寻 址 方式 如 何 支持 高 级 语言 的 多 种 数据 结构 。 
20. 


设 寄存 器 ECX 的 内 容 是 4, 寄存 器 ESI 的 内 容 是 1230H。 请 指出 如 下 每 条 指令 中 存 


储 器 操作 数 的 有 效 地 址 。 


21. 
22. 


MV AL [ESI-5 

MV AX [ESI+ EX 

MY EM [ESI+ECX+ 8+ 100H] 
MY [ESI* 8],AL 

MV [2000H+ EX], EX 


为 什么 目的 操作 数 不 能 采用 立即 寻 址 方式 ? 
通常 情况 下 源 操作 数 和 目的 操作 数 不 能 同时 是 存储 器 操作 数 。 请 写 出 把 存储 器 操作 
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数 甲 送 到 存储 器 操作 数 乙 的 两 种 方法 。 
23. 设 寄存 器 ECX 的 内 容 是 100H ,寄存 器 EDX 的 内 容 是 1234H。 请 写 出 执行 如 下 每 条 
指令 后 ,寄存 器 EAX 的 值 。 
EAX [EX+ 3 
EAX [ECX+ 8] 
EAX [EC ECX+ 4 
EAX [ECX+ DX 2- 引 
EAX [558H 
EAX [567aH] 
24. 请 用 一 条 指令 实现 把 寄存 器 EBX 和 寄存 器 EDX 的 值 相 加 ,同时 减 去 123 ,并 把 结果 
送 到 寄存 器 ECX 。 
25. 绝 大 部 分 条 件 转移 指令 判断 的 条 件 是 什么 ?最 多 会 判断 几 个 条 件 ? 
26. 有 些 条 件 转移 指令 有 多 个 助 记 符 ,请 举例 说 明 。 为 什么 要 这 样 安排 ? 
27. 不 采用 条 件 转移 指令 JG JGE JL 和 JLE, 实 现 如 下 程序 片段 的 功能 。 


下 区 区 区 区 多 


28. 哪些 指令 把 寄存 器 ESP 作为 指针 寄存 器 使 用 ? 
29. 设 堆栈 操作 之 初 寄存 器 ESP 为 00001000H ,执行 下 列 堆栈 操作 指令 后 ,堆栈 的 存储 
情况 如 何 , 请 画 出 示意 图 。 
WY EM 87654321H 
PUSH EX 
pH 以 
POP ER 


30. 请 指出 下 列 指令 的 错误 所 在 。 


(MW CO (2 x [ESD,3 
(3) MW A 30 (4 MY EIP EAX 
(5 SB [EU, [BU (9 PUSH DH 
(7 XH EX XX (8 OP MD 
31. 请 说 明 堆栈 操作 的 特点 。 
32. 在 VC 2010 环境 下 ,编辑 运行 如 下 控制 台 程序 ,并 写 出 运行 结果 。 
#include < stdio.h> 
int vanc 6; 
char dstr[ ]=" abode” ; 
int buff[5]={ 1,2345} ; 
int mair() 
{ 


int var_a, var_b, var_c; 





以 [ESI+ ECX+ 2+ 5] 
var_c, EAX 


各 豆 豆 下” 豆 豆 区 
男 


太 %dBE%dc%dn" ,var a var_b, var_c) ; 
retum 0; 

} 

下 列 编程 题 ,除了 输入 和 输出 操作 之 外 ,请 采用 嵌入 汇编 的 形式 实现 。 

33. 由 用 户 从 键盘 输入 两 个 整数 ( 整 型 ); 把 这 两 个 整数 作为 有 符号 数 ,比较 大 小 ,显示 输 
出 较 大 值 ; 把 这 两 个 整数 作为 无 符号 数 ,比较 大 小 ,显示 输出 较 大 值 。 

34. 由 用 户 从 键盘 输入 两 个 整数 ( 整 型 ); 计算 这 两 个 整数 的 差 ; 显示 输出 上 述 差 的 绝 
对 值 。 

35. 由 用 户 从 键盘 输入 4 个 字符 ,存放 到 字符 数组 中 ; 把 这 4 个 字 节 数据 作为 无 符号 数 ， 
分 别 拼接 成 两 个 字数 据 , 还 拼接 成 一 个 双 字 数据 ; 显示 输出 这 两 个 字数 据 的 值 和 一 个 双 字 数 
据 的 值 。 

36. 由 用 户 从 键盘 输入 一 个 字符 串 ; 统计 该 字符 串 的 长 度 ; 显示 输出 字符 串 长 度 。 

37. 假设 有 一 个 字符 型 数组 ,含有 10 个 字 节 (8 位 ) 整 数 。 可 以 在 定义 字符 型 数组 时 初始 
化 好 这 10 个 数据 ; 也 可 以 由 用 户 输入 。 编 写 程序 实现 : 将 这 些 整数 作为 有 符号 数 ,统计 这 些 
整数 中 正 数 和 负数 的 个 数 ,并 显示 输出 统计 结果 。 

38. 假设 有 一 个 无 符号 字符 型 数组 ,存放 有 20 个 (8 位 ) 数 据 。 可 以 在 定义 数组 时 初始 化 
好 这 20 个 数据 ; 也 可 以 由 用 户 输入 。 如 果 把 两 个 连续 的 字 节 数 据 视 为 一 个 16 位 数据 ,那么 
就 有 10 个 字数 据 ; 如 果 把 4 个 连续 的 字 节 数据 视 为 一 个 32 位 数据 ,那么 就 有 5 个 双 字 数据 。 
编写 程序 实现 : 将 这 些 数据 作为 10 个 16 位 整数 ,统计 正 数 的 个 数 ; 将 这 些 数据 作为 5 个 32 
位 整数 ,统计 负数 的 个 数 ; 显示 输出 统计 结果 。 

39. 假设 有 一 个 字符 型 数组 ,含有 10 个 (8 位) 整数 。 可 以 在 定义 字符 型 数组 时 初始 化 好 
这 10 个 数据 ,也 可 以 由 用 户 输入 。 编 写 程序 实现 : 统计 该 数组 中 10 个 数据 的 累加 和 ; 并 显示 
输出 。 可 以 认为 数组 元 素 中 的 数据 是 无 符号 数 , 也 可 以 是 有 符号 数 。 请 分 别 按 无 符号 数 和 有 
符号 数 情形 ,计算 它们 的 累加 和 (至 少 用 16 位 表示 )。 

40. 假设 有 一 个 整 型 数组 ,存放 有 13 个 无 符号 整数 ,计算 “奇数 之 和 ”与 “偶数 之 和 ”之 差 
的 绝对 值 ,并 显示 输出 。 

41. 简要 说 明 在 VC 2010 环境 下 ,调试 程序 时 观察 寄存 器 和 内 存单 元 的 方法 。 





程序 设计 初步 


结合 C 语言 源 程序 的 目标 代码 ,本章 介绍 基于 IA-32 系列 CPU 的 汇编 语言 程序 设计 , 同 
时 分 析 C 语言 部 分 语句 的 实现 方法 。 在 说 明 堆 栈 的 作用 和 介绍 算术 逻辑 运算 指令 后 ,分 别 介 
绍 分 支 . 循 环 和 子 程序 的 设计 。 


3.1 堆栈 的 作用 


在 2.7 节 介 绍 了 堆栈 ,并 提 及 了 堆栈 的 主要 作用 。 为 了 今后 方便 地 阅读 与 C 语言 源 程序 
对 应 的 目标 代码 ,本 节 将 具体 说 明 堆 栈 的 主要 用 途 : 保存 函数 的 返回 地 址 ; 用 于 向 函数 传递 
参数 ; 安排 函数 的 局 部 变量 。 由 于 这 些 都 与 子 程序 (过 程 ) 有 关 , 因 此 先 介绍 过 程 调 用 和 返回 
指令 。 请 注意 ,这 里 堆栈 的 概念 对 应 高 级 语言 中 栈 的 概念 。 


3.1.1 过 程 调用 和 返回 指令 


在 汇编 语言 中 , 常 把 子 程序 称 为 过 程 (Procedure)。C 语言 中 的 函数 是 子 程序 ,也 就 是 汇 
编 请 言 中 的 过 程 。 
调用 子 程序 (过 程 、 函 数 ) 在 本 质 上 是 控制 转移 , 它 与 无 条 件 转移 的 区 别 是 调用 子 程序 要 考 
虑 返回 。CPU 提供 专门 的 过 程 调用 指令 和 过 程 返回 指令 。 通 常 ,过 程 调用 指令 用 于 由 主 程序 
hy 子 程序 ,过程 返 回 指令 用 于 由 子 程序 返回 到 主 程序 。 
。 示例 分 析 
A C 语言 源 程序 及 其 目标 代码 的 示例 。 
【 例 3-1〗 对 比分 析 如 下 所 示 的 C 语言 源 程序 dp31 和 相应 汇编 格式 指令 的 目标 代码 。 
在 如 下 C 语言 程序 dp31 中 ,main 函数 先 调用 函数 cf211 计算 一 个 表达 式 的 值 ,然后 打印 
输出 结果 。 函 数 cf211 与 2. 5 节 例 2-45 相同 ,计算 一 个 示例 表达 式 , 其 中 的 函数 调用 约定 
_fastcall 表示 希望 通过 寄存 器 来 传递 参数 。 
#include < stdio.h> 
int _fastcall cf21X int x, int y) 
{ 
retum (2+xt Skyt100) ; 
} 
// 作 为 示例 的 主 程序 
int mair() 
下 
int val; 
val= cf21K 23, 456) ; 
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printf"” val=% 中 n" , val) ; 
retun 0; 
] 
在 项 目 属性 中 ,采用 配置 属性 选项 “在 静态 库 中 使 用 MFC”, 同 时 采用 编译 优化 选项 “使 速 
度 最 大 化 ”, 编 译 上 述 程 序 后 ,可 得 到 如 下 所 示 的 用 汇编 格式 指令 表示 的 目标 代码 (标号 和 名 称 
稍 有 修饰 ) ,分 号 之 后 是 添加 的 注释 。 


;函数 cfP211 的 目标 代码 
;通过 寄存 器 EX 和 EX 传递 参数 x 和 y 
cf211 PROC ;过 程 开 始 
lea eax, DNORD PTR [edxt edxk 4+ 100] ;ENE sk yt 100 
lea eax, DNORD PTR [ eaxt ecxk 2] ;EAE EAX+ 2+ x 
ret ;返回 ( 返回 值 在 E 中 ) [ar1 
cf211 EP ;过 程 结束 
;函数 min 的 目标 代码 
_main PROC ;过 程 开 始 
;val= cfP2IY 23, 456) 
mv edk 4% ;由 寄存 器 BX 传 参数 y /pl 
mv ecx, 2 ;由 寄存 器 EX 传 参数 x /fp 
call cf211 ;调用 函数 cf211 [acl 
:printR" val=% d\n" , val) 
push eax ;把 val 值 压 入 堆栈 
push OFFSET FMTS ;把 输出 格式 字符 串 首 地 址 压 人 堆栈 
call _printf ;调用 库 函 数 _ printf [ac2 
add esp, 8 ;平衡 堆栈 [as 
xor eax, eax ;由 ex 传递 返回 值 
ret ;返回 /Mr2 
_main BP ;过 程 结束 


上 述 目 标 代码 中 的 “过 程 开始 "和 “过 程 结 束 ” 行 ,并非 汇编 格式 指令 .但 可 以 认为 这 些 是 汇 
编 语言 的 语句 ,在 形式 上 表示 函数 (过 程 ) 的 代码 的 开始 和 结束 。 

从 上 述 C 语言 源 程序 和 对 应 的 汇编 格式 指令 代码 可 以 看 到 : main 函数 和 cf211 函数 分 别 
对 应 一 个 过 程 ( 子 程序 ) 。 在 过 程 _main 中 ,通过 指令 call 调用 了 过 程 cf211 和 过 程 _printf( 库 
函数 ) 。 在 调用 过 程 cf211 时 ,通过 寄存 器 传递 参数 ,比较 简单 。 但 在 调用 过 程 _printf 时 ,通过 
堆栈 传递 参数 , 先 把 两 个 参数 压 入 了 堆栈 。 在 过 程 cf211 和 过 程 _main 中 ,通过 返回 指令 ret 
返回 到 主 程序 。 函 数 的 返回 值 在 寄存 器 EAX 中 。 

在 标识 符 _main 和 _printf 中 ,为 首 的 下 画 线 是 VC 2010 编译 器 加 上 去 的 ,以 便 符合 编译 
和 链接 的 相关 约定 。 

2. 过 程 调 用 指令 

主 程序 调用 子 程序 ,在 执行 完 子 程序 后 ,再 返回 到 主 程序 。 因 此 ,在 从 主 程 序 转移 到 子 程 
序 时 ,首先 要 保存 返回 地 址 ,以 便 返 回 , 然 后 再 转移 到 子 程序 。 

过 程 调用 指令 实现 由 主 程序 转移 到 子 程序 。 所 以 ,过 程 调用 指令 首先 要 保存 返回 地 址 , 然 
后 再 转移 到 子 程序 的 入 口 地 址 。 为 了 简化 ,可 以 先 这 样 认为 : 所 谓 返 回 地 址 ,就 是 紧 随 过 程 调 
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用 指令 的 下 一 条 指令 的 地 址 偏 移 ( 有 效 地 址 ); 所 谓 转移 到 子 程序 的 入 口 地 址 ,就 是 使 得 指令 
指针 寄存 器 EIP 等 于 子 程序 开始 处 的 地 址 偏 移 。 保 存 返 回 地 址 的 方法 是 把 返回 地 址 压 入 堆 
栈 。 例 如 ,执行 例 3-1 中 调用 指令 “call cf211” 的 操作 ,首先 把 返回 地 址 偏 移 ( 紧 随 其 后 的 指 
令 *push eax” 的 地 址 偏 移 ) 压 入 堆栈 ,然后 使 得 EIP 等 于 函数 cf211 的 第 一 条 指令 “lea eax， 
DWORD PTR [edx 十 edx * 4 十 100]” 的 地 址 偏 移 。 
过 程 调用 指令 有 多 种 方式 ,这 里 先 介绍 最 简单 的 段 内 直接 调用 指令 。 
段 内 直接 调用 指令 的 一 般 格式 如 下 : 
OL WH 
标号 LABEL 可 以 是 程序 中 的 一 个 标号 ,也 可 以 是 一 个 过 程 名 。 
【 例 3-2〗 如 下 指令 演示 了 段 内 直接 调用 指令 的 使 用 。 
CL ”HIOASC ;HIOASC 是 某 个 子 程序 开始 处 的 标号 
OL SBI1 :SLB1 是 某 个 过 程 的 名 称 

段 内 直接 调用 指令 的 具体 操作 : 把 返回 地 址 偏 移 压 和 堆栈; 四 使 得 EIP 的 内 容 为 目标 
地 址 偏 移 ,从 而 实现 转移 。 第 二 步 与 2. 6. 4 节 介 绍 的 无 条 件 转 移 指 令 的 操作 是 相同 的 。 实 际 
上 ,与 无 条 件 转移 指令 JMP 相 比 ,过 程 调用 指令 CALL 只 是 多 了 第 一 步 : 保存 返回 地 址 。 

执行 段 内 直接 调用 指令 CALL 的 堆栈 变化 如 图 3. 1(a)、(b) 所 示 。 在 保护 方式 (32 位 代 
码 段 ) 下 ,返回 地 址 偏 移 占 4 个 字 节 。 

3. 过 程 返 回 指令 

子 程序 在 执行 完 后 ,要 返回 到 主 程序 。 利 用 保存 在 堆栈 中 的 返回 地 址 , 子 程序 就 能 够 方便 
地 返回 主 程序 。 

过 程 返回 指令 用 于 从 子 程序 返回 到 主 程序 。 在 执行 该 指令 时 ,从 堆栈 顶 弹 出 返回 地 址 ,并 
转移 到 所 弹出 的 地 址 ,这 样 就 实现 了 返回 。 通 常 ,这 个 返回 地 址 就 是 在 执行 对 应 的 调用 指令 时 
所 压 入 堆栈 的 返回 地 址 。 

过 程 返 回 指令 的 使 用 应 该 与 过 程 调用 指令 所 对 应 。 这 里 先 介 绍 简 单 的 段 内 返回 指令 。 

简单 的 段 内 返回 指令 的 格式 如 下 : 

FET 

该 指令 从 堆栈 弹出 地 址 偏 移 , 送 到 指令 指针 寄存 器 EIP。 在 保护 方式 (32 位 代码 段 ) 下 ， 
地 址 偏 移 是 一 个 双 字 (32 位 ,4 个 字 节 )。 

执行 简单 的 段 内 返回 指令 RET 的 堆栈 变化 如 图 3.1(b)、(c) 所 示 。 它 与 段 内 调用 指令 相 
对 应 。 

在 例 3-1 的 目标 代码 中 ,注释 带 //@rl 和 //@r2 的 行 ,都 是 返回 指令 RET 的 具体 应 用 。 
在 执行 标 有 //@rl 行 的 返回 指令 "ret" 时 ,从 堆栈 顶 弹 出 在 执行 调用 指令 "call cf211? 时 压 和 人 
堆栈 的 返回 地 址 偏 移 , 把 弹出 地 址 偏 移送 到 EIP, 从 而 返回 到 主 程序 ,继续 从 指令 “push eax” 
开始 执行 。 

【 例 3-3〗 如 下 C 程序 dp32 采用 嵌入 汇编 代码 方式 ,演示 子 程序 的 调用 及 其 返回 ,说 明 
CALL 指令 和 RET 指令 的 使 用 。 其 中 , 子 程序 UPPER 实现 把 寄存 器 AL 中 的 字符 大 写 化 
(如 果 为 小 写字 母 , 则 转换 成 大 写字 母 ,否则 不 变 ); 子 程序 TUPPER 把 寄存 器 AX 中 的 两 个 
字符 大 写 化 。 演 示 步 又 为 ,两 次 调用 子 程序 TUPPER .还 调用 子 程序 UPPER, 把 字符 串 
string 中 的 5 个 字母 转换 为 大 写 。 通 过 C 语言 的 库 函 数 printf 实现 显示 输出 。 当 然 , 这 仅仅 
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(a) 调用 前 的 堆栈 


图 3. 1 


是 个 示例 。 
#include < stdioh> 
char strinrg[ |]=" abode" ; 
int mair() 
{ 


豆 呈 瑟瑟 呈 瑟瑟 一 


ESI, string 
A [ES 
TUPPER 
[ES MX 
A [ESI+ 2 
TUPPER 
[ESI+2, MX 
AL [ESI+ 
UPPER 
[ESI+4],AL 
} 

printf" %s\n" , strine) ; 


retum 0; 

// 嵌 入 汇编 代码 形式 的 子 程序 

_asn{ 

UPPER: 
oP A "a 
B UPR 
QP 4"z 
人 UPPER2 
SB A 2H 

UPPER2: 
RET 

TUPPER: 
OL _ UPPER 
XH8 仙 AL 
OL _ UPPER 
XH8 仙 AL 
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(c) 返回 后 的 堆栈 


(b) 调用 后 的 堆栈 


执行 段 内 调用 指令 时 的 堆栈 变化 示意 图 


/嵌入 汇编 代码 
/ES1 指 向 string 首 


/调用 子 程序 tupper 


/调用 子 程序 tupper 


/调用 子 程序 upper 


/显示 为 ABCDDE 


/代入 汇编 代码 


/于 程序 入 口 标号 


/小 写 转 大 写 
/返回 


// 于 程序 入 口 标号 
/调用 子 程序 


/调用 子 程序 
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FET /返回 

] 

从 上 述 的 嵌入 汇编 代码 可 知 , 子 程序 TUPPER 又 调用 子 程序 UPPER 来 实现 一 个 字符 的 
大 写 化 。 子 程序 TUPPER 和 子 程序 UPPER 都 是 通过 寄存 器 传递 参数 。 

需要 特别 注意 ,上 述 的 程序 组 织 方式 是 把 子 程序 UPPER 和 TUPPER 的 嵌入 汇编 代码 安 
排 在 C 函数 的 return 请 句 之 后 。 这 样 能 够 避免 不 经 过 调用 直接 进入 子 程序 。 如 果 在 有 的 编 
译 器 中 不 能 通过 ,必须 将 UPPER 和 TUPPER 的 嵌入 汇编 代码 安排 在 return 语句 之 前 才能 
通过 ,那么 需要 安排 无 条 件 转移 指令 或 者 goto 语句 跳 过 这 些 子 程序 的 代码 片段 。 


3.1.2 参数 传递 


主 程序 在 调用 子 程序 时 ,往往 要 向 子 程序 传递 一 些 参数 ; 同样 , 子 程序 运行 后 也 经 常 要 把 
一 些 结果 返回 给 主 程序 。 主 程序 与 子 程序 之 间 的 这 种 信息 传递 被 称 为 参数 传递 。 通 常 把 由 主 
程序 传 给 子 程序 的 参数 称 为 子 程序 的 入 口 参 数 , 把 由 子 程序 传 给 主 程序 的 参数 称 为 子 程序 的 
出 口 参 数 。 一 般 而 言 , 子 程序 既 有 入 口 参 数 又 有 出 口 参 数 。 但 有 的 子 程序 只 有 入 口 参 数 , 而 没 
有 出 口 参数 ; 少数 子 程序 只 有 出 口 参数 ,而 没有 入 口 参 数 。 

1. 参数 传递 方法 

有 多 种 传递 参数 的 方法 : 寄存 器 传递 法 .堆栈 传递 法 .约定 内 存单 元 传递 法 和 CALL 后 续 
区 传递 法 等 。 主 程序 与 子 程序 之 间 传 递 参数 的 方法 是 根据 具体 情况 而 事先 约定 好 的 。 有 时 可 
能 同时 采用 多 种 方法 。 

利用 寄存 器 传递 参数 就 是 把 参数 放 在 约定 的 寄存 器 中 。 例 3-3, 就 是 通过 寄存 器 传递 参 
数 。 在 本 节 的 例 3-1 中 ,通过 寄存 器 ECX 和 EDX 给 函数 cf211 传递 入 口 参数 ,通过 寄存 器 
EAX 传递 出 口 参数 。 这 种 方法 的 优点 是 实现 简单 和 调用 方便 。 但 由 于 寄存 器 的 数量 较 少 ,并 
且 寄 存 器 往往 还 要 存放 其 他 数据 ,因此 只 适用 于 传递 少量 参数 的 情形 。 

堆栈 可 以 用 于 传递 参数 ,这 也 是 堆栈 的 一 个 重要 用 途 。 

C 语言 的 函数 通常 利用 堆栈 传递 人 口 参数 ,而 利用 寄存 器 传递 出 口 参数 。 

如 果 使 用 堆栈 传递 人 口 参 数 ,那么 主 程序 在 调用 子 程序 之 前 ,把 需要 传递 的 参数 依次 压 人 
堆栈 ,然后 子 程序 从 堆栈 中 取 入 口 参数 。 

利用 堆栈 传递 参数 可 以 不 占用 寄存 器 ,也 无 须 使 用 额外 的 存储 单元 。 但 由 于 参数 和 子 程 
序 的 返回 地 址 都 一 起 在 堆栈 中 ,有 时 还 要 考虑 保护 寄存 器 ,所 以 较为 复杂 。 

2. 堆栈 传递 参数 的 示例 一 

为 了 说 明 如 何 通过 堆栈 传递 参数 , 先 介绍 一 个 示例 。 

【 例 3-4】 对 比分 析 如 下 所 示 的 C 语言 源 程序 dp33 和 相应 汇编 格式 指令 的 目标 代码 。 

#include < stdio.h> 

int cf3k int x, int y) 

: retum (2+ xt St yt 100) ; 

} 

l 

int mair() 

' 





val= cf34 2 40) ; 
printk" val=%d\n" , val) ; 
retumn 0; 


] 


上 述 C 语言 源 程序 与 例 3-1 的 源 程序 dp31 几乎 相同 ,除了 自 定义 的 函数 名 改 为 cf34 和 


删 掉 了 其 调用 约定 _fastcall 之 外 。 这 样 ,函数 cf34 就 没有 要 求 通过 寄存 器 传递 参数 。 





在 项 目 属性 中 ,采用 配置 属性 选项 “在 静态 库 中 使 用 MFC”, 同 时 采用 编译 优化 选项 “使 速 
度 最 大 化 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 的 用 汇编 格式 指令 表示 的 目标 代码 (标号 和 名 称 


稍 有 修饰 ), 其 中 “DWORD PTR” 表 示 32 位 存储 器 操作 数 , 分 号 之 后 是 添加 的 注释 。 


;函数 cf34 的 目标 代码 
;通过 堆栈 传递 入 口 参数 x 和 y 
cf34 PROC ;过 程 开始 
push ebp ;把 即 压 入 堆栈 
mv ep, esp ;使 得 好 指向 栈 顶 
mv eax, DNOFD PTR [ebpt 1 ;从 堆栈 取 参 数 y 
mv ecx, DWORD PIR [ebpr 8] ;从 堆栈 取 参 数 x 
lea 。 eax，DWORD PTR [eaxt eaxk 4+ 100] ;EAE 5+ y+ 100 
lea eax, DNORD PIR [eaxt ecxk 2] ;EAE EAX+ 2+ x 
pp ep 恢复 E 
ret ;返回 ( 返回 值 在 中 ) 
cf34 BDP ;过 程 结束 
;函数 main 的 目标 代码 
_main PROC ;过 程 开 始 
;val= cf34 2 40) 
push 450 ;把 参数 y( 00000tcaH) 压 入 堆栈 
psh 2 ;把 参数 x( 00000017H) 压 人 堆栈 
call cf% ;调用 函数 cf34 
;printf(" val=% d\n" , val) 
push eax ;把 val 值 压 入 堆栈 
push OFFSET FMTS ;把 输出 格式 字符 串 首 地 址 压 入 堆栈 
call _ printf ;调用 库 函 数 _ printf 
add esp, 16 平衡 堆栈 
xor eax, eax ;由 eax 传 递 返 回 值 
ret ;返回 
_main BP ;过 程 结束 


/My 
/lx 


/lpl 
/Mp 


[as 


与 例 3-1 中 函数 main 的 目标 代码 相 比 , 这 里 函数 main 的 目标 代码 有 3 处 不 一 样 , 见 注释 
带 有 //@pl、//@p2 和 //@s 的 行 。 由 此 可 见 ,函数 cf34 采用 堆栈 传递 入 口 参数 。 当 然 , 库 函 


数 _printf 也 是 通过 堆栈 传递 入 口 参 数 。 


与 例 3-1 中 函数 cf211 的 目标 代码 相 比 ,函数 cf34 的 目标 代码 多 了 几 行 。 因 为 没有 通过 
寄存 器 传 递 参 数 , 所 以 在 开始 计算 表达 式 (2x 十 5y 十 100) 之 前 ,需要 先 从 堆栈 中 取得 入口 参 数 


工 和 wy 的 值 。 
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3. 堆栈 传递 参数 分 析 

通过 堆栈 传递 和 人口 参数 分 为 两 个 方面 : 一 方面 , 主 程序 先 把 入 口 参数 压 入 堆栈 ,然后 利用 
call 指令 调用 子 程 序 ; 另 一 方面 子 程序 (过 程 、 函 数 ) 一 般 会 先 做 必要 的 准备 ,然后 从 堆栈 中 取 
得 参数 。 

图 3.2 给 出 了 例 3-4 中 调用 函数 cf34 以 及 函数 cf34 执行 前 后 的 堆栈 变化 情况 。 

现在 结合 例 3-4 的 目标 代码 和 图 3. 2, 说 明 调 用 函数 cf34 前 后 以 及 它 执 行 期 间 堆栈 的 变 
化 情况 。 在 调用 子 程序 cf34 之 前 , 主 程序 main 先 把 参数 y 和 参数 x 压 人 堆栈 ,这 时 堆栈 就 由 
图 3. 2(a) 变 化 为 图 3.2(b)。 然 后 ,执行 call 指令 ,调用 子 程序 cf34, 调 用 指令 call 把 返回 地 址 
偏 移 压 入 堆栈 ,这 时 堆栈 变化 如 图 3. 2(c) 所 示 ,现在 进入 到 子 程序 cf34。 子 程序 cf34 先 把 寄 
存 器 EBP 压 人 堆栈 ,随即 把 堆栈 指针 寄存 器 ESP 的 值 送 到 EBP, 这 时 堆栈 变化 如 图 3. 2(d) 所 
示 。 现 在 子 程序 cf34 就 可 以 方便 地 从 堆栈 中 取出 相应 的 参数 了 。 然 后 , 子 程序 cf34 执行 相应 
的 功能 。 在 返回 之 前 ,从 堆栈 弹出 刚才 保存 的 EBP 值 ,从 而 恢复 EBP, 这 时 堆栈 就 回 到 如 
图 3. 2(c) 所 示 。 最 后 ,执行 ret 指令 ,返回 到 主 程序 main, 返 回 指令 ret 从 堆栈 弹出 返回 地 址 
偏 移 ,这 时 堆栈 就 回 到 如 图 3. 2(b) 所 示 。 现 在 回 到 了 主 程序 main。 它 接着 执行 其 他 的 指令 ， 
包括 调用 子 程序 _printf 等 。 在 从 子 程序 _printf 返回 后 , 主 程序 main 执行 注释 带 //@s 行 的 
指令 “add esp, 16”, 在 这 之 后 ,堆栈 回 到 如 图 3. 2(a) 所 示 。 











堆栈 底部 堆栈 底部 堆栈 底部 堆栈 底部 
ESP SS SS 
参数 y 值 参数 y 值 参数 y 值 ”| 一 -EBP+12 
ESP 一 =| ”参数 x 值 参数 x 值 参数 x 值 |- EBP+8 
ESP 一 =| 返回 地 址 偏 移 返回 地 址 偏 移 | EBP+4 








ESp_=| EBP |=EBP 
































(a) (b) (9 (d) 
图 3.2 调用 函数 cf34 前 后 堆栈 变化 示意 图 


在 例 3-4 的 目标 代码 中 ,注释 带 //@s 行 指令 的 作用 是 平衡 堆栈 。 因 为 主 程序 main 在 调 
用 子 程序 cf34 之 前 把 两 个 参数 讨 人 堆栈 ,在 调用 子 程序 _printf 之 前 ,又 把 两 个 参数 压 人 堆栈 ， 
这 样 堆栈 项 就 有 4 个 已 经 没有 用 的 参数 了 。 每 个 32 位 的 参数 ,占用 4 个 字 节 。 所 以 利用 指令 
“add ”esp，16” 一 次 性 平衡 堆栈 。 在 例 3-1 的 目标 代码 中 ,也 有 类 似 起 平衡 堆栈 作用 的 指令 
“add ”esp，8”, 参 见 例 3-1 目标 代码 中 标 //@s 的 行 。 在 那里 调用 子 程序 cf211 没有 通过 堆栈 
传递 参数 ,当时 堆栈 项 只 有 两 个 在 调用 子 程序 _printf 之 前 压 人 的 参数 。 实 际 上 ,在 编译 例 3-4 
的 源 程序 dp33 时 ,采用 了 编译 优化 选项 “使 速度 最 大 化 ,这样 所 得 的 目标 代码 把 两 次 平衡 堆 
栈 的 操作 合并 到 了 一 起 。 如 果 不 采 用 编译 优化 ,那么 在 从 子 程序 cf34 返回 后 ,应 该 就 会 立即 
调整 堆栈 指针 寄存 器 ESP 的 值 , 达 到 平衡 堆栈 的 目的 。 

现在 来 看 例 3-4 中 子 程序 cf34 如 何 从 堆栈 中 取得 由 主 程序 压 入 的 参数 x 和 y。 结 合 
图 3.2 可 知 , 子 程序 cf34 的 目标 代码 中 注释 带 //@x 和 //@y 的 行 , 分 别 从 堆栈 中 把 参数 x 和 
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y 取 到 了 寄存 器 ECX 和 EAX 中 。 为 了 通过 寄存 器 EBP 间接 访问 堆栈 , 先 把 堆栈 指针 寄存 器 
ESP 复制 到 EBP, 从 而 使 得 EBP 指向 当时 的 栈 项。 当然 这 会 破坏 寄存 器 EBP 中 原 有 的 内 容 ， 
所 以 子 程序 一 开始 就 把 寄存 器 EBP 的 内 容 压 人 到 堆栈 中 加 以 保护 ,在 返回 之 前 才 恢复 EBP 
原先 的 内 容 。 在 对 应 C 语言 源 程序 的 目标 代码 中 ,通常 会 采用 这 种 方式 来 访问 堆栈 ,包括 存 
取 通 过 堆栈 传递 的 参数 。 在 2. 5. 2 节 介绍 存储 器 寻 址 方式 时 ,曾经 指出 过 ,如 果 基 址 寄存 器 是 
EBP 或 者 ESP ,那么 默认 引用 的 段 寄 存 器 是 SS, 这 正 是 堆栈 段 。 

在 子 程序 开始 时 ,首先 把 EBP 压 人 到 堆栈 ,然后 复制 ESP 到 EBP, 使 得 EBP 指向 堆栈 
顶 ,做 好 通过 EBP 访问 堆栈 的 准备 , 常 把 这 一 步骤 称 为 建立 堆栈 框架 。 在 子 程序 返回 之 前 ,会 
从 堆栈 恢复 EBP, 常 把 这 一 步骤 称 为 撤销 堆栈 框架 。 

4. 堆栈 传递 参数 的 示例 二 

下 面 利用 另 一 个 示例 来 进一步 观察 堆栈 传递 参数 的 情况 。 

【 例 3-5】 分 析 如 下 由 C 语言 编写 的 函数 cf35 的 目标 代码 。 

int cf38 int x, int y) 

{ 

ifR x<y) Ey:; 
return x; 

] 

函数 cf35 有 两 个 整 型 参数 ,返回 值 是 两 个 数 中 的 较 大 者 。 根 据 其 功能 ,也 许 函 数 名 为 
max 更 合适 。 当 然 , 这 仅仅 是 用 于 说 明 堆 栈 传递 参数 的 示例 。 

采用 编译 优化 选项 “使 速度 最 大 化 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 的 用 汇编 格式 指令 
表示 的 目标 代码 (标号 和 名 称 稍 有 修饰 ) ,其 中 “SHORT” 表 示 转 移 目 的 地 就 在 附近 ,分 号 之 后 
是 添加 的 注释 。 


;函数 cf5 的 目标 代码 ( 速度 最 大 化 ) 


cf35 PROC ;表示 过 程 ( 函数 ) 开 始 
push ep 
my ebp, esp ;建立 堆栈 框架 
mov eax, DWRD PIR [ebp+ 8] ;从 堆栈 取 参 数 x 
mv ecx, DWRD PIR [ebpr 12] ;从 堆栈 取 参 数 y 
an eax ecx ;比较 x 和 y(E 钞 代表 x, EX 代表 y) 
jge .SHRT Inicf35 ;如果 x 大 于 等 于 y 就 跳 转 
mov eax, ecx 洋 现 wwy 

Intcf35: 
pp ep ;撤销 堆栈 框架 
ret ;返回 

cf35 BENDP ;表示 过 程 ( 函数 ) 结 束 


从 上 述 目标 代码 可 知 , 子 程序 cf35 首先 设置 EBP 做 好 访问 堆栈 中 参数 的 准备 ; 接着 从 堆 
栈 中 取出 参数 zx 和 >y ,分 别 送 到 寄存 器 EAX 和 ECX, 于 是 EAX 就 相当 于 形 参 zx,ECX 相当 于 
形 参 y; 然后 根据 比较 进行 分 支 .使 得 EAX 含有 较 大 者 ; 最 后 恢复 EBP 并 返回 。 

假设 不 要 求 编 译 优化 , 即 采 用 编译 优化 选项 “已 禁用 ”, 编 译 上 述 C 语言 函数 cf35 后 ,可 得 
到 如 下 所 示 的 目标 代码 ,分 号 之 后 是 添加 的 注释 。 

;函数 cf5 的 目标 代码 ( 禁用 优化 ) 

cf35 PROC ;表示 过 程 ( 函数 ) 开 始 
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ebp，esp ;建立 堆栈 框架 


eax DNORD PTR [ebp+ 1 
SHORT Intcf35 

ecx, DNORD PTR [ebp+ 1 
DWORD PTR [ebpr 8], ecx 


EE 


Intcf35: 
eax，DWRD PIR [ ebp+ 8] 
ebp ;撤销 堆栈 框架 


Ba 


ret 

cf35 BNP ;表示 过 程 ( 函数 ) 结 束 

从 上 述 目标 代码 可 知 ,由 于 没有 采用 “使 速度 最 大 化 ”的 编译 ,因此 把 堆栈 中 的 [ebp 十 8] 
单元 作为 形 参 zx,[ebp 十 12] 单 元 作为 形 参 y。 子 程序 cf35 首先 做 好 访问 堆栈 中 参数 的 准备 ; 
接着 根据 比较 进行 分 支 ,使 得 形 参 z 含有 较 大 者 ; 然后 ,从 形 参 z 中 取出 较 大 者 到 EAX, 作 为 
返回 值 ; 最 后 恢复 EBP 并 返回 。 这 样 处 理 , 效 率 相对 较 低 。 

为 了 进一步 提高 效率 ,采用 编译 优化 选项 “使 速度 最 大 化 ”, 同 时 优化 项 中 还 要 求 “省 略 帧 
指针 ”( 实 际 上 就 是 不 建立 堆栈 框架 ) ,编译 上 述 C 语言 函数 cf35, 可 得 到 如 下 所 示 的 目标 
代码 : 

;函数 cf5 的 目标 代码 ( 速度 最 大 化 , 且 省 略 帧 指针 ) 


cf35 PROC ;表示 过 程 ( 函数 ) 开 始 
mv eax, DWORD PTR [esp+ 4] ;从 堆栈 取 参 数 x 
mv ecx, DWRD PIR [esp+ 8] ;从 堆栈 取 参 数 y 
an eax ecx ;比较 之 
jge SHRT Intcf35 ;大 于 等 于 则 跳 转 
mov eax, ecx ;使 得 E 含 较 大 者 
Intcf35: 
ret 
cf35 BDP ;表示 过 程 ( 函数 ) 结 束 


从 上 述 目 标 代码 可 知 ,由 于 编译 时 要 求 “ 省 略 帧 指针 ”, 因 此 干脆 以 堆栈 指针 寄存 器 ESP 
作为 基 址 寄存 器 ,来 访问 堆栈 中 的 参数 。 这 样 也 就 不 需要 保护 寄存 器 EBP 了 。 如 图 3. 2(c) 所 
示 , 位 于 堆栈 中 的 [esp 十 4] 单 元 含有 参数 zx,[esp 十 8] 单 元 含有 参数 y。 子 程序 cf35 迅速 从 堆 
栈 中 取得 参数 x 和 y ,分 别 送 到 寄存 器 EAX 和 ECX. 并 将 寄存 器 EAX 当 作 形 参 zx, 寄存 器 
ECX 当 作 形 参 y。 这 样 做 ,效率 应 该 是 最 高 的 。 


3.1.3 局 部 变量 


局 部 变量 是 高 级 语言 中 的 概念 。 所 谓 局 部 变量 ,是 指 对 其 访问 仅 限于 某 个 局 部 范围 。 在 
C 语言 中 ,局 部 的 范围 可 能 是 函数 或 复合 语句 。 局 部 变量 还 有 动态 和 静态 之 分 。 

堆栈 可 以 用 于 安排 动态 局 部 变量 。 

1. 局 部 变量 示例 一 

【 例 3-6】 分 析 如 下 由 C 语言 编写 的 函数 cf36 的 目标 代码 。 

int cf3& int x int y) 

{ 





二 
if x<y) Fy; 
retum Zz; 

] 

函数 cf36 的 功能 与 例 3-5 的 函数 cf35 一 样 ,返回 较 大 者 。 作 为 示例 ,特意 安排 了 一 个 局 
部 变量 z。 

如 果 采 用 编译 优化 选项 “使 速度 最 大 化 ,编译 函数 cf36 后 ,所 得 目标 代码 与 例 3-5 的 函数 
cf35 的 目标 代码 完全 一 样 。 由 于 要 求 “使 速度 最 大 化 ”, 因 此 局 部 变量 x 被 “消解 ” 掉 了 。 

为 了 演示 如 何 安 排 局 部 变量 ,假设 不 要 求 编译 优化 , 即 采 用 编译 优化 选项 “已 禁用 ”, 编 译 
上 述 C 语言 函数 cf36。 编 译 后 可 得 到 如 下 所 示 的 用 汇编 格式 指令 表示 的 目标 代码 ,其 中 的 
“DWORD PTR” 表 示 双 字 存 储 单元 ,“SHORT” 表 示 转 移 目 的 地 就 在 附近 ,分 号 之 后 是 添加 的 
注释 。 


cf36 PROC ;表示 过 程 ( 函数 ) 开 始 
push ebp 
my ebp, esp ;建立 堆栈 框架 
push ecx 将 堆栈 中 安排 局 部 变量 z 
x; 
mov eax, DWRD PIR [ebp+ 8] ;取得 形 参 x 
mov DIORD PIR [ebp- 4], eax ; 送 到 变量 z 
;ix< y) 二 yi 
mv ecx, DORD PIR [ebp+ 引 ;取得 形 参 x 
ap ecx DWRD PIR [ebp+ 12] ;比较 x 与 y 
jge SHRT LNicf36 ;如 果 x 大 于 y, 则 跳 转 
mv edx, DNORD PTR [ebp+ 12] ;取得 形 参 y 
mov DIORD PTR [ebp- 4], edx ; 送 到 变量 z 
LNIcf36: 
;retum 2z; 
mv eax, DWRD PIR [ebp-] ;把 z 送 到 EMX 
mov esp, ebp ;撤销 局 部 变量 z 
pp ep ;撤销 堆栈 框架 
ret ;返回 
cf36 EP ;表示 过 程 ( 函数 ) 结 束 


在 没有 采用 编译 优化 的 情况 下 ,所 得 上 述 目标 代码 很 清晰 地 对 应 C 语言 源 程序 的 语句 。 

2. 堆栈 中 的 局 部 变量 

图 3.3 给 出 了 例 3-6 中 函数 cf36 执行 阶段 堆栈 的 变化 情况 。 现 在 来 分 析 对 局 部 变量 = 的 
安排 及 访问 方法 。 

从 例 3-6 的 目标 代码 可 知 ,首先 建立 堆栈 框架 ,这 时 堆栈 就 由 图 3. 3(a) 变 化 为 图 3. 3(b)， 
现在 可 以 基于 EBP 访问 堆栈 了 。 接 着 利用 一 条 push 指令 ,使 得 EBP 减 去 4, 这 时 堆栈 变化 如 
图 3. 3(c) 所 示 。 这 是 关键 所 在 ,其 实质 是 为 局 部 变量 = 在 堆栈 中 安排 存储 单元 ,并 非 要 在 堆 
栈 中 保存 某 个 寄存 器 的 值 。 现 在 局 部 变量 = 出 现 了 ,可 以 基于 EBP 访问 局 部 变量 =。 然 后 , 实 
现 函 数 cf36 的 功能 。 在 邻近 返回 前 ,把 EBP 送 回 到 堆栈 指针 寄存 器 ESP, 这 时 堆栈 由 图 3. 3(c) 
回 到 图 3. 3(b) ,这 意味 着 从 堆栈 中 撤销 局 部 变量 z=。 在 返回 前 ,撤销 堆栈 框架 ,这 时 堆栈 由 
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图 3. 3(b) 变 化 为 图 3. 3(a)。 最 后 ,利用 ret 指令 ,返回 到 主 调 程 序 。 
























































堆栈 底部 堆栈 底部 堆栈 底部 
参数 ? 值 参数 " 值 “|-_-EBp+12 参数 " 值 ”EBP+12 
参数 x 值 参数 x 值 ”EBP+8 参数 x 值 -EBP+8 
ESP 一 一 返回 地 址 偏 移 返回 地 址 偏 移 | EBP+4 返回 地 址 偏 移 Fe 一 EBP+4 
ESP 一 =| EBP -EBP EBP -一 EBP 
ESP 一 =| ”变量 z 值 ”| 一 EBP-4 
































(a) (b) (0) 
3.3 函数 cf36 执行 期 间 堆栈 变化 示意 图 


由 于 局 部 变量 x 在 堆栈 中 , 且 EBP 指向 堆栈 ,如 图 3. 3 所 示 , 因 此 能 够 以 EBP 作为 基 址 
寄存 器 来 访问 局 部 变量 >。 这 种 访问 局 部 变量 的 方法 ,还 是 很 方便 的 。 这 也 是 在 子 程序 开始 
时 先 建立 堆栈 框架 的 原因 。 

3. 局 部 变量 示例 二 

为 了 进一步 说 明 C 语言 局 部 变量 的 安排 ,再 介绍 一 个 示例 。 

【 例 3-7】 分 析 如 下 由 C 语言 编写 的 函数 cf37 的 目标 代码 。 

int cf3X int n) 

{ 

int i, sum; 

suF 0; 

for i=1; i <=n; i+h 
Sumt= ji; 

return sum; 

} 

函数 cf37 的 功能 是 计算 1 到 之 间 的 整数 之 和 。 作 为 示例 ,有 意 采 用 了 一 个 循环 来 求 
和 ,而 且 安 排 了 两 个 局 部 变量 i 和 sum。 

假设 不 要 求 编译 优化 , 即 采 用 编译 优化 选项 “已 禁用 ”, 编 译 上 述 C 语言 函数 cf37 后 ,可 得 
到 如 下 所 示 的 目标 代码 。 


cf37 PROC ;表示 过 程 ( 函数 ) 开 始 
push ep 
mov ep, esp ;建立 堆栈 框架 
sb esp,8 ;安排 局 部 变量 1 和 sm 
mov ”WORD PTR [ebp- 引 ,0 ;sunF 0; 
mov DIORD PTR [ebp-4], 1 ET; 
jmp SHORT LN3cf37 /jl 
LN2cf37: ;i++ 
mv eax, DWORD PIR [ebp- 本 ;取出 i 








add eax 1 
mov DNRD PIR [ebp- 4], eax ; 送 回 | 
LN3cf37: ;比较 i 和 n 
mov ecx, DWRD PTR [ebp-] 
ap ecx, DWORD PIR [ebpr 引 
jg SHORT LNIcf37 ;如 果 i 大 于 n, 则 跳 转 
;sumr= ii 
mv edx, DWORD PIR [ebp- 8] 
add edx, DWORD PTR [ ebp- 
mov DWORD PTR [ebp- 8], edx 
jm SHORT LN2cf37 /Rj 
LNIcf37: 
mv eax, DWRD PTR [ebp- 引 ;准备 返回 参数 
mv esp, ebp ;撤销 局 部 变量 1 和 sum 
pp ep ;撤销 堆栈 框架 
ret 
cf37 BP ;表示 过 程 ( 函数 ) 结 束 


从 上 述 目标 代码 可 知 , 对 应 源 程序 中 的 局 部 变量 i 和 sum 在 堆栈 中 ,分 别 是 LEBP 一 4 和 
[EBP 一 8] 所 指定 的 存储 单元 。 函 数 cf37 执行 阶段 堆栈 的 变化 情况 也 类 似 于 图 3. 3, 不 同 之 处 
是 减少 一 个 参数 ,增加 一 个 局 部 变量 。 读 者 可 以 自行 画 出 堆栈 变化 示意 图 。 

还 请 留意 上 述 目 标 代码 中 注释 带 有 //@jl 和 //@j2 行 的 无 条 件 转移 指令 。 在 //@jl 行 
的 无 条 件 转移 指令 , 跳 过 了 调整 循环 变量 的 代码 。 在 //@j2 行 的 无 条 件 转移 指令 ,转移 到 调 
整 循 环 变量 处 。 这 与 循环 的 具体 实现 有 关 。 


3.2 算术 逻辑 运算 指令 


对 数据 的 处 理 往往 包含 大 量 的 算术 和 逮 辑 运算 ,因此 处 理 器 通常 都 会 提供 算术 运算 指令 和 
逻辑 运算 指令 ,利用 这 些 指令 可 以 进行 各 种 算术 、 逻 辑 运算 操作 。 在 第 2 章 中 已 经 介绍 过 作为 算 
术 运 算 指令 的 加 减 运算 指令 ,本 节 先 介绍 乘除 运算 指令 ,然后 再 介绍 逻辑 运算 指令 和 移 位 指令 。 


3.2.1 乘除 运算 指令 


乘除 运算 指令 分 为 无 符号 数 运算 指令 和 有 符号 数 运算 指令 ,这 与 加 减 运算 指令 不 同 。 乘 
除 运算 指令 对 状态 标志 的 影响 ,也 没有 加 减 运算 指令 那样 自然 。 
在 乘除 运算 指令 中 ,有 时 操作 数 是 隐 含 的 。 
1. 使 用 乘除 运算 指令 的 示例 
在 具体 介绍 乘除 运算 指令 之 前 , 先 介绍 使 用 乘除 运算 指令 的 示例 。 
【 例 3-8】 观察 如 下 由 C 语言 编写 的 函数 cf38 的 目标 代码 。 这 仅仅 是 个 示例 ,其 中 两 个 
inrt cf38 int x int y) 
retum (xtx+3)A 18ty) ; 
} 
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采用 编译 优化 选项 “使 速度 最 大 化 ”, 在 编译 后 可 得 到 如 下 所 示 的 用 汇编 格式 指令 表示 的 
目标 代码 ,分 号 之 后 是 添加 的 注释 。 


push ebp 

mov ebp, ep ;建立 堆栈 框架 

mov eax, DIORD PTR [ebpr 引 ;取出 参数 x 

mv ecx, DIORD PIR [ebp+ 局 ;取出 参数 y 

imul eax, eax ;实现 录 x, 保存 在 EMX 

imul ecx 168 :实现 Bek y, 保存 在 EX 

add eax3 ;实现 录 x 对 3 

cdq :把 电 符 号 扩展 到 EX 形成 多 位 被 除数 ) 
idiv ecx ;: 除 运算 ,EX 及 EM 是 多 位 被 除数 ,EX 是 除数 
pp ep :撤销 堆栈 框架 

ret ;返回 


从 上 述 目标 代码 可 知 ,函数 cf38 采用 3. 1. 2 节 介 绍 的 堆栈 传递 参数 方法 。 在 计算 表达 式 
(x* x 十 3)/(168 * y) 之 前 , 先 从 堆栈 中 取得 参数 x 和。 然后 ,利用 乘法 和 除法 等 指令 计算 该 
表达 式 的 值 。 最 后 通过 寄存 器 EAX 返回 结果 。 
2. 无 符号 数 乘法 指令 (Unsigned Multiply, MUL) 
无 符号 数 乘法 指令 的 格式 如 下 : 
ML avD 
这 条 指令 实现 两 个 无 符号 操作 数 的 乘法 运算 。 指 令 看 似 只 有 一 个 操作 数 OPRD, 实 际 上 ， 
另 一 个 操作 数 是 隐 含 的 ,位 于 寄存 器 AL、AX 或 者 EAX 中 (这 取决 于 操作 数 OPRD 的 尺寸 ) 。 
如 果 OPRD 是 字 节操 作 数 , 则 把 AL 中 的 无 符号 数 与 OPRD 相 乘 ,16 位 结果 送 到 AX 中 ; 如 
果 OPRD 是 字 操 作 数 , 则 把 AX 中 的 无 符号 数 与 OPRD 相 乘 ,32 位 结果 送 到 寄存 器 对 DX: 
AX 中 ,DX 含 高 16 位 ,AX 含 低 16 位 。 如 果 OPRD 是 双 字 操作 数 , 则 把 EAX 中 的 无 符号 数 
与 OPRD 相 乘 ,64 位 结果 送 到 寄存 器 对 EDX:EAX 中 ,EDX 含 高 32 位 ,EAX 含 低 32 位 。 所 
以 由 操作 数 OPRD 决定 是 字 节 相 乘 ,或 是 字 相 乘 ,还 是 双 字 相 乘 。 
操作 数 OPRD 可 以 是 通用 寄存 器 ,也 可 以 是 存储 单元 ,但 不 能 是 立即 数 。 
【 例 3-9】 如 下 指令 演示 无 符号 乘法 指令 的 使 用 。 
ML BE 
ML EX 
如 果 乘 积 的 高 半 部 分 ( 字 节 相 乘 时 为 AH, 字 相 乘 时 为 DX, 双 字 相 乘 时 为 EDX) 不 等 于 
零 , 则 标志 CF==1,OF==1; 否则 CF=0,OF==0。 所 以 ,如 果 CF=1 和 OF=1 表示 在 AH DX 
或 者 EDX 中 含有 结果 的 有 效 数 。 该 指令 对 其 他 状态 标志 无 定义 。 
3. 有 符号 数 乘法 指令 (sIgned MULtiply,IMUL) 
有 符号 数 乘法 指令 能 够 实现 两 个 有 符号 操作 数 的 乘法 运算 。 根 据 指令 中 显 式 的 操作 数 的 
个 数 , 它 有 如 下 3 种 格式 : 
IWL aw 
IML L557 SV 
IML L557. SA, RZ 
(1) 单 操作 数 形式 。 单 操作 数 乘法 指令 实际 上 有 一 个 隐 含 的 操作 数 ,位 于 寄存 器 AL、AX 
或 者 EAX 中 (这 取决 于 操作 数 OPRD 的 尺寸 )。 它 把 被 乘 数 和 乘 数 均 作 为 有 符号 数 ,此 外 与 
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无 符号 乘法 指令 MUL 完全 类 似 。 
【 例 3-10】 如 下 指令 演示 单 操作 数 形式 的 有 符号 乘法 指令 的 使 用 。 
Mm OQ 
IWL DORD PTR [EBP+ 人 ; 双 字 存储 单元 


(2) 双 操 作 数 形式 。 双 操作 数 乘法 指令 实现 两 个 操作 数 相 乘 , 把 乘积 送 到 目的 操作 数 
DEST, 即 : 
DEST < DEST* SRC 
目的 操作 数 DEST 只 能 是 16 位 或 者 32 位 通用 寄存 器 。 但 源 操作 数 SRC 不 仅 可 以 是 通 
用 寄存 器 或 存储 单元 ( 须 与 目的 操作 数 尺寸 一 致 ) ,还 可 以 是 一 个 立即 数 (尺寸 不 能 超过 目的 操 
作 数 ) 。 
在 例 3-8 中 就 利用 了 双 操 作 数 有 符号 乘法 指令 计算 表达 x* x 和 表达 式 168 * y。 
(3) 三 操作 数 形 式 。 三 操作 数 乘法 指令 实现 操作 数 SRC1 与 操作 数 SRC2 相 乘 ,把 乘积 送 
到 目的 操作 数 DEST, 即 : 
DEST <= SRCt+ SRC2 
目的 操作 数 DEST 只 能 是 16 位 或 者 32 位 通用 寄存 器 。 源 操作 数 SRC1 可 以 是 通用 寄存 
器 或 存储 单元 ( 须 与 目的 操作 数 尺寸 一 致 ) ,但 不 能 是 立即 数 。 源 操作 数 SRC2 只 能 是 一 个 立 
即 数 (尺寸 不 能 超过 目的 操作 数 ) 。 
【 例 3-11】 如 下 指令 演示 三 操作 数 形式 的 有 符号 乘法 指令 的 使 用 。 
ML M3 
IWL EDX DWRD PTR [ES ,5 
可 以 把 双 操作 数 乘法 指令 理解 为 三 操作 数 乘法 指令 的 特殊 情形 。 例 如 ， 
IML 俯 了 7 
ML 以 俯 7 
对 于 双 操作 数 或 者 三 操作 数 乘法 指令 而 言 , 由 于 存放 乘积 的 目的 操作 数 的 尺寸 与 被 乘 数 
(或 乘 数 ) 的 尺寸 相同 ,因此 乘积 有 可 能 溢出 。 如 果 乘 积 溢出 ,那么 高 位 部 分 将 被 截 掉 。 这 也 解 
释 了 作为 源 操作 数 的 立即 数 , 其 尺寸 不 能 超过 目的 操作 数 尺寸 的 原因 。 
虽然 双 操 作 数 或 者 三 操作 数 乘法 指令 是 有 符号 数 乘法 指令 ,但 在 不 考虑 溢出 的 情况 下 ,也 
可 以 用 于 无 符号 数 乘法 操作 。 因 为 无 论 操作 数 是 有 符号 数 还 是 无 符号 数 ,乘积 的 低位 部 分 是 
相同 的 。 这 也 解释 了 无 符号 乘法 指令 没有 双 操 作 数 形式 和 三 操作 数 形式 的 原因 。 
对 于 单 操作 数 乘法 指令 ,如 果 乘 积 的 高 半 部 分 含有 有 效 位 , 则 标志 CF 二 1, OF 二 1; 否则 
CF 二 0,OF 二 0。 对 于 双 操 作 数 或 者 三 操作 数 乘法 指令 ,如 果 因 为 溢出 而 将 乘积 的 高 位 部 分 截 
掉 , 则 标志 CF==1,OF==1; 否则 CF 二 0.OF 一 0。 因 此 ,在 这 样 的 乘法 指令 后 可 安排 检测 OF 
的 条 件 转移 指令 ,用 于 处 理 乘 积 溢出 的 情况 。 有 符号 数 乘法 指令 对 其 他 状态 标志 无 定义 。 
4. 无 符号 数 除法 指令 (DIVide.DIV) 
无 符号 数 除法 指令 的 格式 如 下 : 
DV am 
这 条 指令 实现 两 个 无 符号 操作 数 的 除法 运算 。 指 令 看 似 只 有 一 个 操作 数 OPRD( 作 为 除 
数 ) ,实际 上 , 另 一 个 操作 数 ( 作 为 被 除数 ) 是 隐 含 的 ,位 于 寄存 器 AX、 寄 存 器 对 DX:AX 或 者 寄 
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存 器 对 EDX:EAX 中 (DX 含有 被 除数 的 高 16 位 ,或 者 EDX 含有 被 除数 的 高 32 位 )。 如 果 
OPRD 是 字 节 操作 数 , 则 把 AX 中 的 无 符号 数 除 以 OPRD, 所 得 商 送 到 AL 中 ,余数 送 到 AH 
中 ; 如 果 OPRD 是 字 操 作 数 , 则 把 寄存 器 对 DX:AX 中 的 无 符号 数 除 以 OPRD, 所 得 商 送 到 
AX, 余 数 送 到 DX 中 。 如 果 OPRD 是 双 字 操 作 数 , 则 把 寄存 器 对 EDX:EAX 中 的 无 符号 数 除 
以 OPRD, 所 得 商 送 到 EAX 中 ,余数 送 到 EDX 中 。 所 以 由 操作 数 OPRD 决定 是 字 节 除 ,或 是 
字 除 ,还 是 双 字 除 。 
操作 数 OPRD 可 以 是 通用 寄存 器 ,也 可 以 是 存储 单元 ,但 不 能 是 立即 数 。 
无 符号 数 除法 指令 对 状态 标志 的 影响 无 定义 。 
【 例 3-12〗 如 下 指令 演示 无 符号 数 除法 指令 的 使 用 。 
DV BL 
DIV ESI 
除法 操作 有 个 特殊 情况 需要 注意 。 如 果 除 数 为 0 或 者 商 太 大 , 则 将 引起 除法 出 错 异常 (或 
者 中 断 )。 所 谓 商 太 大 ,是 指 除法 操作 后 所 得 商 超 出 了 用 于 存放 商 的 寄存 器 的 范围 , 即 在 字 节 
除 时 商 超过 字 节 ,或 者 在 字 除 时 商 超过 字 ,或 者 双 字 除 时 商 超过 双 字 。 在 第 8 章 将 介绍 实 方式 
下 中 断 的 相关 概念 ,在 第 9 章 将 介绍 保护 方式 下 异常 的 相关 概念 。 
【 例 3-13】 如 下 指令 演示 除法 指令 因 商 太 大 导致 除法 出 错 异常 。 
WW A 600 
WW BL 2 
DV BE 
如 果 执 行 上 述 代码 片段 ,所 得 商 应 该 是 300, 超 出 了 AL 的 表示 范围 (无 符号 数 最 大 255)， 
将 引起 除法 出 错 异常 。 
5, 有 符号 数 除法 指令 (sIgned DIVide,IDIV) 
有 符号 数 除法 指令 的 格式 如 下 : 
IDIV 09D 


这 条 指令 实现 两 个 有 符号 操作 数 的 除法 运算 。 指 令 看 似 只 有 一 个 作为 除数 的 操作 数 
OPRD, 实 际 上 ,作为 被 除数 的 另 一 个 操作 数 是 隐 含 的 ,位 于 寄存 器 AX 寄存器 对 DX:AX 或 
者 寄存 器 对 EDX:EAX 中 (取决 于 操作 数 OPRD 的 尺寸 )。 它 把 被 除数 和 除数 均 作 为 有 符号 
数 , 用 于 保存 商 和 余数 的 寄存 器 与 无 符号 数 除法 指令 DIV 一 样 。 

如 果 不 能 整除 ,余数 的 符号 与 被 除数 一 致 ,而 且 余数 的 绝对 值 小 于 除数 的 绝对 值 。 

如 果 除 数 为 0, 或 者 商 太 大 ( 正 数 ) 或 者 太 小 (负数 ) , 则 将 引起 除法 出 错 异 常 。 

有 符号 数 除法 指令 对 状态 标志 的 影响 无 定义 。 

【 例 3-14】〗 如 下 指令 演示 有 符号 数 除 法 指令 的 使 用 。 


IDIV_ CQL ;被 除数 在 以 中 ,所 得 商 在 AL, 余 数 在 用 
IDIV EX ;被 除数 在 EX:EM 中 ,所 得 商 在 EX, 余数 在 EX 
6. 符号 扩展 指令 


由 于 除法 指令 隐 含 使 用 字 被 除数 、 双 字 被 除数 或 者 四 字 被 除数 (寄存 器 对 EDX:EAX) , 因 
此 有 时 需要 在 除 操作 之 前 扩展 被 除数 ,也 就 是 增 大 操作 数 的 尺寸 ,以 便 符合 要 求 。 另 外 ,为 了 
避免 因 商 太 大 或 者 太 小 引起 除法 出 错 异常 ,需要 扩展 除数 和 被 除数 。IA-32 系列 CPU 专门 提 
供 了 符号 扩展 指令 。 
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(1) 字 节 转换 为 字 指令 (Convert Byte to Word,CBW)。 字 节 转 换 为 字 指 令 的 格式 如 下 : 
CBN 


这 条 指令 把 寄存 器 AL 中 的 符号 扩展 到 寄存 器 AH。 即 若 AL 的 最 高 有 效 位 为 0, 则 
AH=0; 若 AL 的 最 高 有 效 位 为 1, 则 AH=0FFH, 即 AH 的 8 位 全 都 为 1。 数 值 后 缀 的 符号 
H 表示 十 六 进 制 。 

【 例 3-15】 如 下 指令 演示 CBW 指令 的 使 用 ,注释 部 分 给 出 了 指令 执行 后 寄存 器 的 内 容 。 

WW A 381H AE 381H, 即 MF 34, A= BH 
CBN ;AH OFFH, A= 8H, 即 AE OFFBH 

假设 被 除数 在 AL 中 ,CBW 指令 使 得 被 除数 扩展 到 AH ,从 而 产生 一 个 字 长 度 的 被 除数 。 

(2) 字 转 换 为 双 字 指令 (Convert Word to Double word,CWD)。 字 转换 为 双 字 指令 的 格 
式 如 下 : 

oap 

这 条 指令 把 寄存 器 AX 中 的 符号 扩展 到 寄存 器 DX。 即 若 AX 的 最 高 有 效 位 为 0, 则 
DX=0; 若 AX 的 最 高 有 效 位 为 1, 则 DX 二 0FFFFH, 即 DX 的 16 位 全 都 为 1。 

这 条 指令 能 在 两 个 字 操 作 数 相 除 以 前 ,产生 一 个 双 字 长 度 的 被 除数 。 

(3) 双 字 转换 为 四 字 指 令 (Convert Doubleword to Quadword,CDQ)。 双 字 转 换 为 四 字 
指令 的 格式 如 下 : 

mn 

这 条 指令 把 寄存 器 EAX 中 的 符号 扩展 到 寄存 器 EDX。 即 若 EAX 的 最 高 有 效 位 为 0, 则 
EDX=0; 若 EAX 的 最 高 有 效 位 为 1, 则 EDX 二 0FFFFFFFFH, 即 EDX 的 32 位 全 都 为 1。 在 
例 3-8 的 目标 代码 中 ,有 该 指令 的 运用 。 

(4) 另 一 条 字 转 换 为 双 字 指令 (Convert Word to Double Word,CWDE)。 另 一 条 字 转 换 
为 双 字 指令 的 格式 如 下 : 

OWE 

这 条 指令 把 寄存 器 AX 中 的 符号 扩展 到 寄存 器 EAX 的 高 16 位 。 即 若 AX 的 最 高 有 效 位 
为 0, 则 EAX 的 高 16 位 都 为 0; 车 AX 的 最 高 有 效 位 为 1, 则 EAX 的 高 16 位 都 为 1。 

这 条 指令 类 似 于 CBW ,把 AL 中 的 符号 位 扩展 到 AX; 但 不 同 于 CWD, 不 是 把 AX 的 符 
号 位 扩展 到 DX, 而 是 扩展 到 EAX 的 高 16 位 。 

这 四 条 符号 扩展 指令 ,不 影响 各 状态 标志 。 

【 例 3-16】 如 下 C 程序 dp39 及 其 嵌入 汇编 代码 ,演示 除法 指令 和 符号 扩展 指令 的 使 用 。 

#include < stdio.h> 


int mair() 
{ 
int quotient, remainder; /为 了 输出 结果 ,安排 两 个 变量 
_asm{ 
WA- 6 
MV BL10 
IDV EE // 除 数 是 B, 被 除数 是 以 


MV BLAH // 先 临时 保存 余数 
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CBN / 商 在 多, 符号 扩展 到 以 
QIDE /以 符号 扩展 到 EMX 
MOV quotient, EAX 
MV ALB /余数 送 到 儿 
CBN /由 符 号 扩展 到 以 
OE /以 符号 扩展 到 EMX 
MV remainder, EAX 
!} 
printf" quotient=% d\n”" , quotient) ; // 显 示 为 - 
printf" remainder=% d\n" , remainder) ; // 显 示 为 -1 
printRk" \n" ) ; 
AN/ 
_asm{ 
MV 从- él 
OD /以 符号 扩展 到 以 
MV BX3 
IDIV BX /人 除数 是 以 ,被 除数 是 以 :以 
OWE, / 商 在 以 ,符号 扩展 到 EMX 
MOV quotient, EAX 
MV AXDX /余数 以 送 到 以 
OWE, /符号 扩展 到 EM 
MOV ”remainder, EAX 
} 
printf" quotient=% d\n" , quotient) ; // 显 示 为 - 20 
printf" remainder=% d\n" ，remainder) ; // 显 示 为 -1 
retun 0; 


] 

上 述 演 示 程 序 分 两 部 分 ,第 一 部 分 演示 16 位 被 除数 和 8 位 除数 的 情形 ,在 实施 除法 操作 
后 ,利用 符号 扩展 指令 把 商 和 余数 分 别 扩展 成 32 位 ,并 送 到 对 应 变量 中 。 第 二 部 分 演示 32 位 
被 除数 和 16 位 除数 的 情形 。 这 时 虽然 实际 的 被 除数 可 以 用 16 位 表示 ,但 由 于 除数 太 小 ,实施 
除法 操作 会 导致 溢出 ,因此 必须 先 把 被 除数 扩展 到 32 位 表示 。 当 然 ,也 可 以 把 被 除数 扩展 到 
64 位 ,这 是 解决 除法 溢出 的 方法 。 

注意 ,在 无 符号 数 除 操作 之 前 ,不 宜 利用 CBW、CWD 或 者 CDQ 指令 来 扩展 符号 位 ,一般 
采用 逻辑 异 或 XOR 指令 把 高 8 位 高 16 位 或 者 高 32 位 直接 清 0, 即 进行 无 符号 扩展 。 

7. 扩展 传送 指令 

为 了 更 加 高 效 ,IA-32 系列 CPU 还 提供 了 两 条 扩展 传送 指令 ,利用 它们 可 以 在 传送 数据 
的 过 程 中 完成 符号 扩展 或 者 零 扩 展 (无 符号 扩展 ) 。 

(1) 符号 扩展 传送 指令 (Move with Sign-Extension,MOVSX) 。 符 号 扩展 传送 指令 的 格 
式 如 下 : 

MMX 0E5T, Sm 


此 指令 把 源 操 作 数 SRC 符号 扩展 后 送 至 目的 操作 数 DEST。 
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源 操作 数 SRC 可 以 是 通用 寄存 器 或 存储 单元 ,而 目的 操作 数 DEST 只 能 是 通用 寄存 器 。 
与 普通 传送 指令 不 同 ,目的 操作 数 的 尺寸 必须 大 于 源 操作 数 的 尺寸 。 源 操作 数 的 尺寸 可 以 是 
8 位 或 者 16 位 ; 目的 操作 数 的 尺寸 可 以 是 16 位 或 者 32 位 。 

符号 扩展 传送 指令 不 会 改变 源 操作 数 , 也 不 影响 标志 寄存 器 中 的 状态 标志 。 

【 例 3-17】 如 下 指令 演示 MOVSX 指令 的 使 用 ,注释 部 分 给 出 了 指令 执行 后 寄存 器 的 内 
容 ,数据 末 的 后 级 HH 表示 十 六 进 制 。 


Wy A, a A= 8H 
MX EX A ;DX FFFFFFB8EH 
WX C&A ;OF FF85H 
WY A A=H 
MMSX EXAL ;EAX= O0000075H 


(2) 零 扩 展 传送 指令 (Move with Zero-Extend, MOVZX)。 零 扩展 (无 符号 扩展 ) 传 送 指 

令 的 格式 如 下 : 
MMX 057 Sm 

此 指令 把 源 操作 数 SRC 零 扩展 后 送 至 目的 操作 数 DEST。 

源 操作 数 SRC 可 以 是 通用 寄存 器 或 存储 单元 ,而 目的 操作 数 DEST 只 能 是 通用 寄存 器 。 
源 操 作 数 的 尺寸 可 以 是 8 位 或 者 16 位 ; 目的 操作 数 的 尺寸 只 可 以 是 16 位 或 者 32 位 。 

零 扩 展 (无 符号 扩展 ) 传 送 指令 不 会 改变 源 操作 数 ,也 不 影响 标志 寄存 器 中 的 状态 标志 。 

【 例 3-18〗 如 下 指令 演示 MOVZX 指令 的 使 用 ,注释 部 分 给 出 了 指令 执行 后 寄存 器 的 内 
容 ,数据 末 的 后 组 H 表示 十 六 进 制 。 


MV DX, 888H DE 8885H 
MMX EX DL ;EDE 00000085H 
MMX EM DX ;EAX= 00008885H 


【 例 3-19】 比较 分 析 如 下 由 C 语言 编写 的 函数 cf310 和 cf311 的 目标 代码 。 这 仅仅 是 示 
例 , 请 注意 参数 的 类 型 和 函数 返回 值 的 类 型 。 


int cf31Q char x, char y) 
{ 
retun (xt+2)Ny; 
} 
AN/ 
unsigned int cf31K unsigned char x unsigned char y) 
( 
retum (unsigned) (x+ 2Z)Ny ; 
} 


在 编译 后 可 得 到 如 下 所 示 的 用 汇编 格式 指令 表示 的 目标 代码 ,其 中 “BYTE PTR” 表 示 字 
节 存 储 单元 ,分 号 之 后 是 添加 的 注释 。 


;函数 cf310 的 目标 代码 

push ep 

mv ebp，esp ;建立 堆栈 框架 

mvsx eax, BYTE PTR [ebp+ 8] ;把 参数 x 符号 扩展 后 送 到 eax 
add eax 2 


movsx ecx, BYTE PTR [ebp+ 启 ;把 参数 y 符 号 扩展 后 送 到 ecx 
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cdq ;符号 扩展 ,形成 4 位 的 被 除数 
idiv ecx 

pp ep ;撤销 堆栈 框架 

ret 

;函数 cf311 的 目标 代码 

push ep 

mov ep, ep ;建立 堆栈 框架 

movzx eax, BYTE PIR [ebpr 引 ;把 参数 x 零 扩展 后 送 到 eax 
add eax 22 

movzx 。 ecx BYTE PIR [ebp+ 人 局 ;把 参数 y 零 扩展 后 送 到 ecx 
xor edx, edx ; 零 扩 展 , 形 成 4 位 的 被 除数 [az 
div ecx 

pp ep ;撤销 堆栈 框架 

ret 


从 上 述 目 标 代码 可 以 清楚 地 看 到 符号 扩展 传送 指令 MOVSX 和 零 扩 展 传送 指令 
MOVZX 的 作用 ,还 可 以 看 到 对 于 有 符号 数 ,采用 符号 扩展 指令 cdq 来 形成 64 位 的 被 除数 ( 存 
放 在 EDX:EAX 寄存 器 对 中 ) ,对 于 无 符号 数 ,采用 逻辑 异 或 指令 xor 直接 把 edx 清 0, 从 而 形 
成 64 位 的 被 除数 。 

细心 的 读者 也 许 会 发 现在 C 函数 cf311 中 安排 了 强制 类 型 转换 。 这 是 为 了 演示 相关 指令 
有 意 安排 的 。 如 果 不 做 这 样 的 安排 ,目标 代码 又 会 怎么 样 ? 


3.2.2 逻辑 运算 指令 


在 C 语言 中 有 一 组 按 位 逻辑 运算 符 ,它们 是 按 位 取 反 运算 符 ( 一 ) 、 按 位 与 运算 符 ( 必 )、 按 
位 或 运算 符 (|)、 按 位 异 或 运算 符 (^)。 利 用 这 些 运算 符 , 可 以 方便 地 进行 各 种 位 运算 。 
IA-32 系列 CPU 提供 一 组 逻辑 运算 指令 ,包括 否 (NOT) .与 (AND)、 或 COR)、 异 或 
(XOR) 等 。 这 些 逻 辑 运算 指令 实际 的 操作 就 是 按 位 运算 ,确切 地 说 是 按 位 进行 的 逻辑 运算 。 
1. 使 用 人 逻辑 运算 指令 的 示例 
【 例 3-20】 观察 如 下 由 C 语言 编写 的 函数 cf312 的 目标 代码 。 这 仅仅 是 个 示例 ,其 中 两 
个 参数 都 是 无 符号 整 型 。 
unsigned int cf312 unsigned int x, unsigned int y) 
{ 
int 到 0; 
i 议 (x&3)|1|(( 盖 5 y)) 
{ 
三 x“ 25; 
} 
retum Zz; 
} 
假设 不 要 求 编译 优化 , 即 采 用 编译 优化 选项 “已 禁用 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 
的 用 汇编 格式 指令 表示 的 目标 代码 (标号 稍 有 修饰 ) ,分 号 之 后 是 添加 的 注释 。 
;函数 cf312 的 目标 代码 ( 无 编译 优化 ) 
push ep 
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mov 

mv 

and 

jne 

mv ecx, DIORD PTR [ebpr 引 

sub ecx 5 

mv edx, DNORD PTR [ebpt 僻 

not edx 

or ecx, edx 
je SHORT LN2cf312 

LNIcf312: 
mv 
Xxor 


eax, DWORD PTR [ebpt+ 8] 
eax, 25 
mv DNRD PTR [ebp- 4], eax 


;建立 堆栈 框架 
:安排 局 部 变量 z 


;到 0; 


到 出 参数 x 
xX&3 
:如 结果 不 为 0 表示 条 件 成 立 , 跳 转 


;又 取出 参数 x 

-5 

;取出 参数 y 

Pi 

{ww | y 

;如 结果 为 0, 表示 条 件 不 成 立 , 跳 转 


:条件 成 立 

;又 取出 参数 x 
x*25 

;保存 x 


准备 返回 


;准备 返回 值 
撤销 局 部 变量 z 
撤销 堆栈 框架 


从 上 述 目标 代码 可 知 ,函数 cf312 不 仅 采用 3.1. 2 节 介绍 的 堆栈 传递 参数 方法 ,而 且 还 采 
用 3.1.3 节 介 绍 的 在 堆栈 中 安排 局 部 变量 的 方法 。 在 计算 表达 式 时 ,利用 了 逻辑 运算 指令 ,最 


后 通过 寄存 器 EAX 返回 结果 。 


2. 关于 逻辑 运算 指令 的 通用 说 明 


IA-32 系列 CPU 提供 的 逻辑 运算 指令 ,除了 上 述 的 否 (NOT) .与 (AND) ,或 (OR)、 异 或 
(XOR) 外 ,还 有 测试 指令 TEST ,而 且 除 了 指令 NOT 外 , 均 有 两 个 操作 数 。 关 于 这 组 指令 有 


如 下 几 点 通用 说 明 。 


(1) 只 有 通用 寄存 器 或 存储 单元 可 作为 目的 操作 数 , 用 于 存放 运算 结果 。 

(2) 如 果 只 有 一 个 操作 数 , 则 该 操作 数 既 是 源 又 是 目的 。 

(3) 如 果 有 两 个 操作 数 ,那么 最 多 只 能 有 一 个 是 存储 单元 , 源 操作 数 可 以 是 立即 数 。 
(4) 存储 单元 可 采用 2. 5 节 中 介绍 的 各 种 存储 器 操作 数 寻 址 方式 。 

(5) 操作 数 可 以 是 字 节 、 字 或 者 双 字 。 但 如 果 有 两 个 操作 数 , 则 它们 的 尺寸 必须 一 致 。 


3. 否 运算 指令 (NOT) 
NOT 运算 指令 的 格式 如 下 : 
NT AD 


这 条 指令 把 操作 数 OPRD 按 位 * 取 反 ”, 然 后 送 回 OPRD。 按 位 “ 取 反 ”是 指 把 为 0 的 位 设 


置 成 1, 把 为 1 的 位 清 成 0。 


【 例 3-21】 如 下 指令 演示 NOT 运算 指令 的 使 用 。 
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niet ne 
AD LOBT Sm 
这 条 指令 对 两 个 操作 数 进行 按 位 的 逻辑 “与 ”运算 ,结果 送 到 目的 操作 数 DEST。 按 位 
“与 ?是 指 当 两 个 操作 数 对 应 位 都 为 1 时 ,把 结果 的 对 应 位 设置 成 1, 否则 清 成 0。 
该 指令 使 得 标志 CF==0, 标 志 OF 一 0, 标 志 PF、ZF、SF 反映 运算 结果 ,标志 AF 未 定义 。 
【 例 3-22】 如 下 指令 演示 “与 ”运算 指令 的 使 用 ,注释 是 执行 指令 后 有 关 寄 存 器 的 内 容 。 


AD EX EI 
WW 从 33H JIAE IIH 
AD A OFFH JAE OOH 


某 个 操作 数 自己 与 自己 相 “ 与 ”, 则 值 不 变 , 但 可 使 进位 标志 CF 清 为 0。“ 与 ”运算 指令 主 
要 用 在 使 一 个 操作 数 中 的 若干 位 维持 不 变 , 而 另外 若干 位 清 为 0 的 场合 。 把 要 维持 不 变 的 这 
些 位 与 “1? 相 “与 ”, 而 把 要 清 为 0 的 这 些 位 与 “0” 相 “与 ”就 能 达到 此 目的 。 
5. 或 运算 指令 (OR) 
OR 运算 指令 的 格式 如 下 : 
R OBET Sm 
这 条 指令 对 两 个 操作 数 进行 按 位 的 逻辑 "或 "运算 ,结果 送 到 目的 操作 数 DEST。 按 位 
“或 "是 指 当 两 个 操作 数 对 应 位 都 为 0 时 ,把 结果 的 对 应 位 清 成 0 ,否则 设置 成 1。 
【 例 3-23】 如 下 指令 演示 “或 ”运算 指令 的 使 用 。 
RR wa 
OR EE 
该 指令 使 标志 CF==0, 标 志 OF==0, 标 志 PF、ZF、SF 反映 运算 结果 ,标志 AF 未 定义 。 
某 个 操作 数 自己 与 自己 相 “ 或 ”, 则 值 不 变 , 但 可 使 进位 标志 CF 清 为 0。“ 或 "运算 指令 主 
要 用 在 使 一 个 操作 数 中 的 若干 位 维持 不 变 , 而 另外 若干 位 置 为 1 的 场合 。 把 要 维持 不 变 的 这 
些 位 与 “0” 相 “或 ”, 而 把 要 设置 为 1 的 这 些 位 与 *1” 相 “或 就 能 达到 此 目的 。 
【 例 3-24】 如 下 指令 演示 “或 ”运算 指令 的 使 用 ,注释 是 执行 指令 后 有 关 寄 存 器 的 内 容 。 


MV 人 AL 4H ;AL= 01000001B, 后 绥 B 表 示 二 进 制 
RR AL 2H ;AL= O11O0001B 

6. 异 或 运算 指令 (XOR) 

XOR 运算 指令 的 格式 如 下 : 
XR OBEBT SP 


这 条 指令 对 两 个 操作 数 进行 按 位 的 逻辑 “ 异 或 ”运算 ,结果 送 到 目的 操作 数 DEST。 按 位 
“ 异 或 "是 指 当 两 个 操作 数 对 应 位 不 同时 ,把 结果 的 对 应 位 设置 成 1, 当 两 个 操作 数 对 应 位 相同 
时 ,把 结果 的 对 应 位 清 成 0。 

该 指令 使 标志 CF 二 0, 标 志 OF 二 0, 标 志 PF、ZF、SF 反映 运算 结果 ,标志 AF 未 定义 。 

【 例 3-25】 如 下 指令 演示 “ 异 或 ”运算 指令 的 使 用 ,注释 是 执行 指令 后 有 关 寄 存 器 的 





内 容 。 
XR EX EX :ECE 0, 0F=0 
MV A 34 ;AL= 00110100B, 后 绥 B 表 示 二 进 制 
WW Bo ;B= 00001111B 
XR 人 L 已 ;A= 00111011B 


某 个 操作 数 自己 与 自己 相 “ 异 或 ”, 则 结果 总 是 为 0。 这 是 因为 每 一 个 对 应 位 肯定 都 相同 ， 
所 以 结果 的 每 一 位 都 为 0。 因 此 ,上 述 第 一 条 指令 执行 后 ,ECX 为 0。 经 常会 采用 异 或 指令 把 
寄存 器 的 内 容 清 零 。 例 3-19 函数 cf311 的 目标 代码 中 ,就 利用 “xor edx edx” 指 令 将 寄存 器 
EDX 清 为 0, 实现 无 符号 数 的 扩展 。 

“ 异 或 "操作 指令 主要 用 在 使 一 个 操作 数 中 的 若干 位 维持 不 变 , 而 另外 若干 位 设置 取 反 的 
场合 。 把 要 维持 不 变 的 这 些 位 与 “0” 相 “ 异 或 ”, 而 把 要 取 反 的 这 些 位 与 “1” 相 “ 异 或 ”就 能 达到 
此 目的 。 

7. 测试 指令 (TEST) 

测试 指令 的 格式 如 下 : 

TEST L057 Sm 

这 条 指令 和 AND 指令 类 似 , 也 是 把 两 个 操作 数 进行 按 位 “与 ”, 但 结果 不 送 到 目的 操作 数 
DEST ,仅仅 影响 状态 标志 。 该 指令 执行 以 后 ,标志 ZF、PF 和 SF 反映 运算 结果 ,标志 CF 和 
OF 被 清 为 0。 

该 指令 通常 用 于 检测 某 些 位 是 否 为 1, 但 又 不 希望 改变 操作 数值 的 场合 。 就 像 比较 指令 
CMP ,能 够 影响 状态 标志 ,但 不 影响 操作 数 的 值 。 

【 例 3-26】 如 下 指令 检查 AL 中 的 位 6 和 位 2 是 否 有 一 位 为 1。 

TEST AL O1000100B ;后 绥 B 表 示 二 进 制 

如 果 位 6 和 位 2 全 为 0, 那 么 在 执行 上 面 的 指令 后 ,ZF 被 设置 为 1, 否则 ZF 被 清 0。 在 程 
序 中 ,随后 的 指令 可 以 根据 ZF 进行 分 支 转移 。 

【 例 3-27】 比较 分 析 例 3-20 中 函数 cf312 的 另 一 个 版 本 的 目标 代码 。 

采用 编译 优化 选项 “使 速度 最 大 化 ”, 重 新 编译 函数 cf312 ,可 得 到 如 下 所 示 的 用 汇编 格式 
指令 表示 的 目标 代码 。 


;函数 cf312 的 目标 代码 ( 使 速度 最 大 化 ) 
push ep 
mv ebp, ep ;建立 堆栈 框架 
mv ecx, DWORD PTR [ebpr 引 ;取出 参数 x 
xor eax, eax :到 0 
test cl, 3 测试 x 的 低 8 位 (x&3) 
jne SHORT LNicf312 
push esi : 临 时 保存 BI 
mv esi, DIORD PIR [ebp+ 僻 ;取出 参数 y 
not esi iy 
lea edx, DWRD PTR [ecx- 引 5 
or edx, esi tw y 
pp esi ;恢复 EI 
je SHRT LN2cf312 
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xor ex 25 x^25 

mov eax, ecx ;准备 返回 值 
LN2cf312: 

pp gp :撤销 堆栈 框架 

ret 


从 上 述 目 标 代码 可 知 ,由 于 采用 了 “使 速度 最 大 化 ”的 编译 选项 ,因此 就 没有 把 局 部 变量 安 
排 在 堆栈 中 ,而 是 把 EAX 作为 局 部 变量 z=。 此 外 ,还 使 用 TEST 指令 代替 了 AND 指令 。 


3.2.3 移 位 指令 


IA-32 系列 CPU 有 三 大 类 移 位 指令 : 一 般 移 位 指令 、 循 环 移 位 指令 和 双 精 度 移 位 指令 。 
按 移 位 的 方向 ,这 三 大 类 移 位 指令 又 可 分 为 左 移 移 位 指令 和 右 移 移 位 指令 。 

移 位 指令 实现 把 某 个 通用 寄存 器 或 者 某 个 存储 单元 的 内 容 , 按 某 种 方式 向 左 或 者 向 右 移 
动 一 位 或 者 m 位 。 移 位 指令 中 要 标明 需要 移 位 的 操作 数 , 这 个 操作 数 既是 源 操作 数 又 是 目的 
操作 数 ; 移 位 指令 还 要 标明 需要 移动 的 位 数 , 可 以 是 一 个 8 位 的 立即 数 ,或 者 是 寄存 器 CL。 

1. 一 般 移 位 指令 

一 般 移 位 指令 包括 算术 左 移 指令 (Shift Arithmetic Left,SAL)、 逻 辑 左 移 指 令 (SHift 
logic Left,SHL) .算术 右 移 指令 (Shift Arithmetic Right,SAR)、 逻 辑 右 移 指 令 (SHift logic 
Right,SHR)。 这 些 指令 的 格式 如 下 : 


SL OD cout ;算术 左 移 指令 ( 同 罗 辑 左 移 指令 ) 
SL OD cout ; 巡 辑 左 移 指令 ( 同 算术 左 移 指令 ) 
SR FD cout ;算术 右 移 指令 
SR OD cout ; 远 辑 右 移 指令 


操作 数 OPRD 可 以 是 通用 寄存 器 ,也 可 以 是 存储 器 单元 ,其 尺寸 可 以 是 字 节 、 字 或 者 双 
字 , 如 果 是 存储 单元 ,可 以 采用 各 种 存储 器 操作 数 寻 址 方式 。count 表示 移 位 的 位 数 ,可 以 是 
一 个 8 位 立即 数 ,也 可 以 是 寄存 器 CL。 寄 存 器 CL 表示 移 位 数 由 CL 的 值 决定 。 通 过 截取 
count 的 低 5 位 ,实际 的 移 位 数 被 限于 0 一 31 之 间 。 

这 些 指令 执行 后 ,标志 CF 受 影 响 ; 标志 SF、ZF 和 PF 反映 移 位 后 的 结果 ; 标志 OF 受 影 
响 情况 较 复 杂 ; 标志 AF 未 定义 。 

(1) 算术 左 移 或 逻辑 左 移 指令 (Shift Arithmetic Left 或 SHift logic Left, SAL/SHL)。 
算术 左 移 和 逻辑 左 移 进行 相同 的 动作 ,是 一 样 的 ,为 了 方便 理解 ,有 两 个 助 记 符 ,但 只 有 一 条 机 
器 指令 。 

算术 左 移 指 令 SAL/ 逻 辑 左 移 指令 SHL 把 操作 数 OPRD 左 移 count 位 ,同时 每 向 左 移动 
一 位 ,右边 用 0 补足 一 位 ,移出 的 最 高 位 进入 标志 位 CF ,如 图 3. 4Ca) 所 示 。 

【 例 3-28】 如 下 的 代码 片段 用 于 说 明 SHL 指令 的 使 用 ,注释 给 出 了 指令 执行 后 的 操作 
数值 和 部 分 标志 的 变化 情况 。 


MOV EX /00H :BE MEFIH 

AD EO0 ;BE EFIH, (= 0 SF= 0 = 0F=1 
SL EX 1 :BE EB0IDF39H (= 0 5=1,F=0F=0 
MV C3 =3 

SL EO :BE 0FFPIO00N, = 1,S= 0 0F=1 
SL EX 16 :BE PPO, (= 0 SE= 1 QF=1 





SH EM 12 ;BE 00000000H (= 0 SF= 0 1,F=1 
只 要 左 移 之 后 的 结果 未 超出 一 个 字 节 、 一 个 字 或 者 一 个 双 字 的 表达 范围 ,那么 每 左 移 一 
次 , 原 操 作 数 每 一 位 的 权 增加 了 一 倍 , 即 相当 于 原 数 乘 以 2。 
【 例 3-29】 如 下 的 代码 片段 实现 把 寄存 器 AL 中 的 内 容 ( 设 为 无 符号 数 ) 乘 以 10, 结 果 存 
放 在 AX 中 。 


XR 有 用 ;AHF0 
SH 以 1 ;MkX 
MW BA 洗 存 人 #X 
SH 以 2 ;8BkX 
AD 以 以 :Bt Xt 4X 


(2) 算术 右 移 指令 (Shift Arithmetic Right,SAR) 。 算 术 右 移 指令 SAR 把 操作 数 OPRD 
右 移 count 位 ,同时 每 向 右 移 一 位 ,左边 的 符号 位 保持 不 变 , 移 出 的 最 低位 进入 标志 位 CF ,如 
图 3.4(b) 所 示 。 





一 





CF 最 高 有 效 位 ”操作 数 最 低 有 效 位 
| -0 


(a) 逻辑 左 移 /算术 左 移 指令 











最 高 有 效 位 。 操作 数 。 最 低 有 效 位 。 CF 


最 高 有 效 位 。 操作 数 。 最 低 有 效 位 。 CF 


[| 




















(b) 算术 右 移 指令 





0 -| 














(c) 逻辑 右 移 指令 
图 3.4 一 般 移 位 指令 执行 示意 图 


【 例 3-30】 如 下 的 程序 片段 用 于 说 明 SAR 指令 的 使 用 ,注释 给 出 了 指令 执行 后 的 操作 数 
值 和 部 分 标志 的 变化 情况 ,请 注意 符号 位 (最 高 有 效 位 ) 的 变化 。 


MW DX 82031 DE 8203H 

SR DX1 DEC TS 170P=0 
MV CQ.3 =3 

SR DO IDE FanH OO0S=1T=0F=0 
SR 以 4 ;De FF8H OF=1S=1T=0F=1 


对 于 有 符号 数 或 无 符号 数 而 言 ,算术 右 移 一 位 相当 于 除 以 2。 但 在 非 整 除 的 情况 下 与 使 
用 IDIV 指令 不 完全 一 样 。 
(3) 人 逻辑 右 移 指令 (SHift logic Right,SHR)。 逻 辑 右 移 指令 使 操作 数 OPRD 右 移 count 
位 ,同时 每 向 右 移 一 位 ,左边 用 0 补足 ,移出 的 最 低位 进入 标志 位 CF, 如 图 3.4(c) 所 示 。 
【 例 3-31】 如 下 的 代码 片段 用 于 说 明 SHR 指令 的 使 用 ,注释 给 出 了 指令 执行 后 的 操作 
数值 和 部 分 标志 的 变化 情况 。 
MY DX 8203H DE 8203H 
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SR 以 1 
MV CQCL3 
SR DO 
SR DX 12 


DEA6HO15F0F0F0 
:=3 

DE OOH CO0S=0TFEOPF-0 
;De 0000H = 1S=0 下 1FF=1 


对 于 无 符号 数 而 言 ,逻辑 右 移 一 位 相当 于 除 以 2。 
【 例 3-32】 分 析 如 下 由 C 语言 编写 的 函数 cf313 的 目标 代码 。 这 仅仅 是 个 示例 ,其 中 两 


个 参数 都 是 无 符号 整 型 。 


unsigned cf313 unsigned x, unsigned y) 


{ 


retum (x<2)-(y>4d-(x/2)-(y* 8) ; 


} 


假设 不 要 求 编译 优化 , 即 采用 编译 优化 选项 “已 禁用 ”, 编 译 上 述 程 序 后 ,可 得 到 如 下 所 示 
的 用 汇编 格式 指令 表示 的 目标 代码 ,分 号 之 后 是 添加 的 注释 。 
;函数 cf313 的 目标 代码 ( 不 要 求 编译 优化 ) 


push ebp 
ebp，esp 
eax，DWORD PTR 
eax, 2 
ecx, DWORD PTR 
ecx 4 
eax, ecx 
edx, DWORD PTR 
edx 5 
eax，edx 
ecx DWRD PTR 
ecx 3 
eax，ecX 
ep 


RABE28848843233 


Lebp+ 8] 


Lebp+ 何 


Lebp+ 引 





Lebp+ 何 


;建立 堆栈 框架 
;取得 参数 x 
:把 x 向 左 移 2 位 
;取得 参数 y 

;把 y 向 右 移 4 位 


;取得 参数 x 
;无 符号 整数 除 以 了 


;取得 参数 y 

汝 以 8 
;返回 结果 存放 在 EM 中 
撤销 堆栈 框架 


从 上 述 目标 代码 可 知 ,C 语言 中 移 位 运算 符 的 实现 ; 同时 还 可 以 看 到 ,2 次 宕 运算 的 实现 


方法 。 
2. 循环 移 位 指令 


循环 移 位 指令 包括 左 循环 移 位 指令 (ROtate Left,ROL) \ 右 循环 移 位 指令 (ROtate Right， 
ROR) 、 带 进位 左 循环 移 位 指令 (Rotate through CF Left, RCL), 带 进位 右 循环 移 位 指令 
(Rotate through CF Right, RCR)。 这 些 指令 的 格式 如 下 : 


RL Om omt 
RR Om ort 
RL Om ot 
RR OM cmt 


湛 循 环 移 位 指令 
泡 循 环 移 位 指令 
澡 进位 左 循环 移 位 指令 
北 进 位 右 循 环 移 位 指令 


操作 数 OPRD 可 以 是 通用 寄存 器 ,也 可 以 是 存储 器 单元 ,其 尺寸 可 以 是 字 节 、 字 或 者 双 
字 。count 表示 移 位 的 位 数 ,可 以 是 一 个 8 位 立即 数 ,也 可 以 是 寄存 器 CL。 寄 存 器 CL 表示 移 
位 数 由 CL 的 值 决定 。 通 过 截取 count 的 低 5 位 , 移 位 数 被 限于 0 一 31 之 间 , 而 且 为 了 更 加 有 
效 ,真正 的 移 位 数 还 受到 操作 数 OPRD 尺寸 长 度 的 限制 。 





这 些 指令 执行 后 ,标志 CF 受 影响 ; 标志 OF 受 影响 情况 稍 复杂 ; 其 他 状态 标志 不 受 


前 两 条 循环 移 位 指令 没有 把 进位 标志 位 CF 包含 在 循环 的 环 中 ; 后 两 条 循环 移 位 指令 
进位 标志 CF 包含 在 循环 的 环 中 , 即 作为 整个 循环 的 一 部 分 。 这 4 条 循环 移 位 指令 的 操作 
图 3.5 所 示 。 


把 
如 



































CF 最 高 有 效 位 操作 数 最 低 有 效 位 
(a) 左 循环 移 位 指令 ROL 
-一 | 
(b) 右 循环 移 位 指令 ROR 











Ls = "| 


(©) 带 进位 左 循环 移 位 指令 RCL 
| = | 


(d) 带 进位 右 循 环 移 位 指令 RCR 
3.5 循环 移 位 指令 执行 示意 图 


左 循环 移 位 指令 ROL 是 指 把 操作 数 OPRD 循环 左 移 count 位 。 每 向 左 移 一 位 ,操作 数 
的 最 高 位 移入 最 低位 ,同时 最 高 位 也 移入 进位 标志 CF。 

右 循 环 移 位 指令 ROR 是 指 把 操作 数 OPRD 循环 右 移 count 位 。 每 向 右 移 一 位 ,操作 数 
的 最 低位 移入 最 高 位 ,同时 最 低位 也 移入 进位 标志 CF。 

带 进位 左 循环 移 位 指令 RCL 是 指 把 操作 数 OPRD 连同 CF 循环 左 移 count 位 。 每 向 左 
移 一 位 ,操作 数 的 最 高 位 移入 进位 标志 CF .CF 移入 操作 数 的 最 低位 ,这 也 被 称 为 大 循环 左 移 。 

带 进 位 右 循环 移 位 指令 RCR 是 指 把 操作 数 OPRD 连同 CF 循环 右 移 count 位 。 每 向 右 
移 一 位 ,操作 数 的 最 低位 移 人 进位 标志 CF,CF 移入 操作 数 的 最 高 位 ,这 也 被 称 为 大 循环 右 移 。 

【 例 3-33〗 如 下 的 程序 片段 用 于 说 明 循 环 移 位 指令 的 使 用 ,注释 给 出 了 指令 执行 后 的 操 
作 数 值 和 标志 CF 的 情况 。 


























Ww DX 8203 De 8203H 

RL D1 ;DX= O68H, C=1 

MV C3 =3 

RL DO De 2038 OF=0 

WW EX 83FH :BE BBFH 

RR EX4 :BE AIFH 00 
STC :FE《 设置 进位 标志 
RL EX 1 :BE FI40GBFH 00 
RR EO :BE DE2B8DH OF 1 


利用 循环 移 位 指令 ,能 够 方便 地 实现 在 一 个 操作 数 内 部 的 移 位 。 利 用 带 进位 循环 移 位 指 
令 ,能 够 实现 跨 操作 数 之 间 的 移 位 。 
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【 例 3-34】 下 面 的 代码 片段 实现 把 AL 的 最 低位 送 入 BL 的 最 低位 , 仍 保持 AL 不 变 。 


RR B.1 得 循环 右 移 一 位 
RR AL1 沪 循 环 右 移 一 位 ,最 低位 到 0F 
RL BL1 症 带 进位 左 移 , 带 进 了 来 自 包 的 最 低位 
RL AL1 恢复 全 

3. 双 精 度 移 位 指令 


为 了 方便 地 把 一 个 操作 数 中 的 部 分 内 容 通过 移 位 方式 复制 到 另 一 个 操作 数 ,IA-32 系列 
CPU 提供 了 双 精 度 移 位 指令 。 按 移动 的 方向 ,分 为 左 移 和 右 移 , 即 双 精 度 左 移 指令 SHLD 和 
双 精 度 右 移 指令 SHRD。 

双 精 度 移 位 指令 的 一 般 格 式 如 下 : 

SHD OFD1 QR comt 
SD OFD1 OR comt 

操作 数 OPRD1 作为 目的 操作 数 可 以 是 通用 寄存 器 ,也 可 以 是 存储 器 单元 ,其 尺寸 是 字 或 
者 双 字 。 操 作 数 OPRD2 相当 于 源 操作 数 , 只 能 是 寄存 器 ,其 尺寸 必须 与 操作 数 OPRD1 一 致 。 
count 表示 移 位 的 位 数 ,可 以 是 一 个 8 位 立即 数 ,也 可 以 是 寄存 器 CL。 寄 存 器 CL 表示 移 位 数 
由 CL 的 值 决定 。 通 过 截取 count 的 低 5 位 , 移 位 数 被 限于 0 一 31 之 间 。 

双 精 度 左 移 指令 SHLD 是 指 把 目的 操作 数 OPRD1 左 移 指定 的 count 位 ,在 低 端 空 出 的 
位 用 操作 数 OPRD2 高 端的 count 位 填补 ,但 操作 数 OPRD2 的 内 容 保 持 不 变 。 操 作 数 
OPRDI1 中 最 后 移出 的 位 保留 在 进位 标志 CF 中 。 

双 精 度 右 移 指令 SHRD 是 指 把 目的 操作 数 OPRDI1 右 移 指 定 的 count 位 ,在 高 端 空 出 的 
位 用 操作 数 OPRD2 低 端 的 count 位 填补 ,但 操作 数 OPRD2 的 内 容 保 持 不 变 。 操 作 数 
OPRDI1 中 最 后 移出 的 位 保留 在 进位 标志 CF 中 。 

在 截取 低 5 位 之 后 ,如 果 count 为 0, 不 进行 任何 操作 ; 如 果 count 仍然 超过 操作 数 的 尺 
寸 , 那 么 目的 操作 数 的 结果 无 定义 ,各 状态 标志 也 无 定义 。 

在 仅仅 移动 一 位 的 情况 下 , 当 符 号 位 发 生变 化 , 则 置 溢出 标志 OF ,否则 清 OF。 双 精度 移 
位 指令 还 影响 标志 SF、ZF 和 PF, 对 AF 无 定义 。 

【 例 3-35】 下 面 的 代码 片段 用 于 说 明 循 环 移 位 指令 的 使 用 ,注释 给 出 了 指令 执行 后 的 操 
作 数 值 和 标志 CF 的 情况 。 

以 82IH 
DX, 567eH 


MDX1 A= O60H, DX= S678H, CF= 1, OF= 1 
MX DX 2 A 1909H, DE 5678H, OF= 0, OF= 0 


EAX 0123486H 

EDX SABODEFH 

EMX EDX 4 ;ENE 90123484H, CF= 0, OF= 1 

C8 

EAX EX QL :ENE F9901234, (= 1, OF= 0 

利用 双 精 度 移 位 指令 ,能 够 比较 方便 地 实现 跨 操作 数 之 间 的 移 位 。 
【 例 3-36】 下 面 的 程序 片段 实现 例 3-34 的 要 求 。 


SR BMI1 


妆 写 妆 吕 号 ”色色 可 





RL 以 1 
【 例 3-37〗 下 面 的 指令 可 实现 把 EAX 中 的 32 位 数 保存 到 寄存 器 对 DX:AX 中 。 
SHD EX EAX 16 


3.3 分 支 程序 设计 


几乎 所 有 的 程序 都 不 是 从 头 顺序 地 执行 到 尾 , 而 是 在 处 理 中 经 常 存在 着 判断 ,并 根据 某 种 
条 件 的 判定 结果 转向 不 同 的 处 理 。 这 样 程序 就 不 再 是 简单 地 顺序 执行 ,而 是 分 成 两 个 或 多 个 
分 支 。 在 2.6 节 介 绍 条 件 转移 指令 和 无 条 件 转移 指令 的 基础 上 ,本 节 先 结合 C 语言 实例 函数 
的 目标 代码 ,介绍 分 析 实 现 分 支 的 基本 方法 ,然后 进一步 说 明 无 条 件 转移 指令 和 条 件 转移 


指令 。 
3.3.1 分 支 程序 设计 示例 


分 支 程序 的 两 种 基本 结构 如 图 3. 6 所 示 , 这 两 种 结构 分 别 对 应 C 语言 中 的 过 语句 和 
if-else 语句 。 在 汇编 语言 中 ,利用 条 件 转移 指令 和 无 条 件 转移 指令 实现 分 支 。 


Hi 满足 A 
1 








ZK 
今 
wr 
ZK 
今 
a 
a 
ZK 
仿 
二 
之 
S 






































(a) (b) 
图 3.6 分 支 程 序 的 结构 示意 图 


1. 简单 分 支 示例 
下 面 先 来 看 两 个 C 语言 函数 的 目标 代码 ,从 中 了 解 简 单 分 支 的 实现 方法 。 
【 例 3-38】 分 析 如 下 C 语言 编写 的 函数 cf315 的 目标 代码 。 
int cf318 int ch) 
{ 
议 ch>="'A' 8 ch <='7') 
cht = 0020; /小 写字 母 与 对 应 大 写字 母 ASCII 码 相 差 也 
return ch; 
} 
函数 cf315 的 功能 是 字符 小 写 化 (如 果 为 大 写字 母 , 则 转换 成 小 写字 母 , 否 则 不 变 )。 考 虑 
到 通用 性 和 效率 ,所 以 参数 和 返回 值 都 是 整 型 。 
假设 不 要 求 编译 优化 , 即 采 用 编译 优化 选项 “已 禁用 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 
的 用 汇编 格式 指令 表示 的 目标 代码 (标号 稍 有 修饰 )。 其 中 ,“DWORD PTR” 表 示 双 字 存 储 
单元 “SHORT” 表 示 转 移 目 的 地 就 在 附近 ,分 号 之 后 是 添加 的 注释 。 
;函数 cf315 的 目标 代码 ( 不 采用 编译 优化 ) 
push ep 
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mov ep, ep ;建立 堆栈 框架 
ii ch>='A 下 中 <='Z) 
amp DIORD PTR Lepr 引 ,6 


jl SHORT LNicf315 ;小 于 , 则 跳 转 
ap DW PTR Lebpr 引 , % 
jg SHORT LNicf315 ;大 于 , 则 跳 转 
;cdhr= 000; 

mv eax, DWORD PTR [ebpr 引 
add eax 2 

LNtcf315: iretun ah; 
mov eax, DWORD PTR [ebpr 引 ;返回 值 
pp ep ;撤销 堆栈 框架 
ret ;返回 


从 上 述 目 标 代 码 可 知 , 在 建立 堆栈 框架 后 ,堆栈 中 的 存储 单元 [EBP 十 8] 就 是 入 口 参 数 
ch。 两 处 分 支 转移 都 是 属于 图 3. 6(a) 的 结构 ,都 采用 条 件 转移 指令 实现 。 
另外 ,在 例 3-3 的 程序 dp32 中 ,采用 嵌入 汇编 代码 形式 的 子 程序 UPPER 实现 类 似 的 功 
能 (字符 大 写 化 ) 。 但 是 , 它 通过 寄存 器 AL 传递 参数 ,所 以 显得 简单 些 。 
如 果 采 用 编译 优化 选项 “使 速度 最 大 化 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 的 目标 代码 
(标号 稍 有 修饰 ) 。 
;函数 cf315 的 目标 代码 ( 使 速度 最 大 化 ) 


push ebp 

mov ebp, esp ;建立 堆栈 框架 
iif ch>="A' & ch<='2") 

mv eax, DWORD PTR [ebpr 引 

lea ecx DWRD PTR [eax 66] 

ap ecx 5 

ja SHORT LNicf315 
:cht = 000; 

add eax 3 

LNIcf315: ;return ah; 
pp ”ebp ;撤销 堆栈 框架 


从 上 述 目标 代码 可 知 ,确实 进行 了 很 好 的 优化 处 理 。 首 先 , 减 少 了 一 次 分 支 转移 。 这 是 很 
有 价值 的 。 源 程序 中 的 条 件 虽然 由 两 个 关系 表达 式 组 成 ,但 实质 是 判断 是 否 属于 某 个 区 域 范 
围 [zx,yj], 因 此 就 被 巧妙 地 合并 到 一 起 ,成 为 判断 是 否 属于 [0,y 一 +]。 减 少 转移 ,有 助 于 提高 
执行 效率 。 因 此 尽量 减少 转移 ,是 优化 的 目标 之 一 。 其 次 ,充分 利用 寄存 器 ,这 也 是 提高 执行 
效率 的 手段 。 

【 例 3-39】 分 析 把 一 位 十 六 进 制 数 转换 为 对 应 ASCII 码 的 目标 代码 。 

十 六 进 制 数 需要 用 16 个 符号 来 表示 。 除 了 0 一 9 外 ,还 用 了 6 个 字母 ,也 就 是 大 写 的 字母 
A~F, 或 者 小 写 的 字母 a~f。 为 了 输出 数据 ,通常 需要 把 数据 转换 成 对 应 的 字符 串 ,也 就 是 由 
数据 的 每 一 位 所 对 应 字符 构成 的 字符 串 , 而 字符 一 般 用 ASCII 码 表示 ,这 样 也 就 形成 了 
ASCII 码 串 。 

假定 十 六 进 制 数 用 0 一 9 和 大 写字 母 A~F 来 表示 ,那么 一 位 十 六 进 制 数 与 对 应 ASCII 码 
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的 关系 如 表 3. 1 所 示 。 
表 3.1 一 位 十 六 进 制 数 与 对 应 ASCUII 码 的 关系 
十 六 进 制 数 | 0 1 2 3 4 5 6 7 8 9 A B CcC D E F 





ASCII 码 30H 31H 32H 33H 34H 35H 36H 37H 38H 39H 41H 42H 43H 44H 45H 46H 


这 种 对 应 关系 可 表示 为 一 个 分 段 函 数 : 
_ (z+30H (0<x<9) 
5 si (OAH<z<OFH) 
如 下 所 示 C 语言 编写 的 函数 cf316 ,能 够 实现 上 述 的 转换 功能 。 





int cf3lk int m) /人 口 参数 为 一 位 十 六 进 制 数 
{ 
nF m & OOf: /确保 一 位 十 六 进 制 数 ( 在 0 全 之 间 ) 
ifRm< 10) 
mt = 0G0; // 数 字符 0 9 
else 
mt = Ox37; /字母 F 
return m; 


] 
假设 不 要 求 编译 优化 ,编译 上 述 程 序 后 ,可 得 到 如 下 所 示 的 目标 代码 (标号 稍 有 修饰 )。 其 
中 ,“SHORT” 表 示 转 移 目 的 地 就 在 附近 。 
;cf316 目 标 代 码 ( 禁止 编译 优化 ) 


push ebp 
mov ep, ep ;建立 堆栈 框架 
MF m & OOf; 
mv eax, DWRD PTR [ebp+r 8] 
and eax 15 
mov DWORD PTR [ebpr 8], eax 
iif m< 10) 
amp DIORD PTR [ebp+ 8], 10 
jg SHRT LNZcf316 
‘mt = 0G0; 
add ecx 4 
mv DWORD PTR [ebp+r 8], ecx 
Jjmp SHORT LNicf316 :Mj 
LN2cf316: mt = Ox37; 
add ek 瑟 
LNicf316: iretum mi 
mov eax, DWORD PTR [ ebp+ 8] ;EMX 含 返回 值 
pp gp :撤销 堆栈 框架 
ret 


从 上 述 目 标 代 码 可 知 , 在 堆栈 中 的 存储 单元 LEBP 十 8] 就 是 参数 mw。 由 于 没有 要 求 编译 优 
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化 ,因此 每 次 操作 形 参 m 后 ,都 又 保存 到 存储 单元 中 ,这 样 整个 代码 显得 比较 元 长 。 代 码 的 分 
支 结构 如 图 3.6(b) 所 示 , 其 中 利用 无 条 件 转 移 指令 jmp 跳 过 对 应 “else” 部 分 的 代码 ,这 样 在 完 
成 分 支 之 后 ,两 部 分 又 合并 到 了 一 起 ,参见 代码 中 注释 带 //@j 的 行 。 

采用 编译 优化 选项 “使 速度 最 大 化 ”, 编 译 上 述 程 序 后 ,可 得 到 如 下 所 示 的 目标 代码 : 


;cf316 目 标 代码 ( 使 速度 最 大 化 ) 
push ep 
mv ebp, esp ;建立 堆栈 框架 
mFm& OF; 
mov eax, DWORD PTR [ebpt+ 8] 
ad eax 15 
iif m< 10) 
ap eax 10 
jg SHRT UN2cf316 
mt = 0x30; 
add eax 2 
pp Ep 
ret 
LN2cf316: ‘mt = Ox37; 
ad eax5 
pp ep 
ret 


从 上 述 目标 代码 可 知 , 在 两 个 方面 进行 了 优化 处 理 。 一 方面 ,把 寄存 器 EAX 作为 形 参 变 
量 。 在 从 堆栈 中 取得 参数 m 后 ,对 形 参 wm 的 操作 就 在 寄存 器 EAX 中 进行 了 。 另 一 方面 ,避免 
了 无 条 件 转 移 指令 jmp。 分 支 的 两 部 分 ,各 自 完成 后 不 再 合并 到 一 起 ,而 是 直接 返回 。 虽 然 经 
过 了 编译 优化 ,但 似乎 还 可 以 进一步 优化 。 

2. 分 支 的 优化 

减少 转移 是 优化 的 目标 之 一 。 从 上 述 两 个 经 过 编译 优化 的 目标 代码 都 可 以 清楚 地 看 到 这 
一 点 。 虽 然 现代 的 编译 器 能 够 实施 优化 ,但 源 程序 自身 结构 的 优化 仍然 很 重要 。 

一 般 情况 下 ,如 果 分 支 结构 为 图 3.6(b) ,并 且 其 中 一 个 分 支 比较 简单 时 ,可 考虑 把 它 改 变 
转换 为 图 3. 6(a) 的 结构 。 具 体 方法 为 : 在 判断 之 前 先 假设 满足 简单 的 情形 。 

【 例 3-40】 优化 例 3-39 的 源 程序 。 

对 例 3-39 程序 中 分 支 的 一 边 稍 作 变 形 , 可 使 其 包含 分 支 的 另 一 边 ,分 支 结 构 就 从 图 3. 6 
(b) 退 化 为 图 3.6(a)。 如 下 所 示 的 函数 cf317 是 优化 后 的 源 程序 。 如 此 调整 分 支 后 ,使 得 处 理 
既 简 单 又 高 效 。 

int cf31X int m) 

nF m & OOf; 

mt = Ox30; 
ifRm> '9) 
m=7; 
return m; 
} 


采用 编译 优化 选项 “使 速度 最 大 化 ”, 编 译 上 述 程 序 后 ,可 得 到 如 下 所 示 的 目标 代码 : 


90 。 新 概念 汇编 语言 





;cf317 目标 代码 ( 使 速度 最 大 化 ) 


从 上 述 目 标 代码 可 知 ,只 含 一 个 条 件 转 移 指令 。 相 比例 3-39 两 个 版 本 的 目标 代码 , 它 确 
实 既 简单 又 高 效 。 


3.3.2 无 条 件 和 条 件 转 移 指 令 


在 2.6.4 节 和 2.6.2 节 介绍 过 无 条 件 转移 指令 和 条 件 转移 指令 ,为 了 更 好 地 应 用 这 些 指 
令 实现 分 支 程序 设计 ,本 节 作 更 进一步 的 介绍 。 

1. 相关 基本 概念 

存储 器 的 分 段 管理 使 得 转移 稍 显 复 杂 。 由 于 程序 代码 可 分 为 多 个 段 ,因此 根据 转移 时 是 
否 重 置 代码 段 寄 存 器 CS 的 内 容 , 转 移 又 可 分 为 段 内 转移 和 段 间 转 移 两 大 类 。 段 内 转移 是 指 
仅仅 重新 设置 指令 指针 寄存 器 EIP 的 转移 ,由 于 没有 重 置 CS, 因 此 转移 后 继续 执行 的 指令 仍 
在 同一 个 代码 段 中 。 段 间 转 移 是 指 不 仅 重新 设置 EIP, 而 且 重 新 设置 代码 段 寄存 器 CS 的 转 
移 , 由 于 重 置 CS, 因 此 转移 后 继续 执行 的 指令 在 另 一 个 代码 段 中 。 段 内 转移 也 称 为 近 转 移 , 段 
间 转 移 也 称 为 远 转 移 。 

条 件 转移 指令 和 循环 指令 (将 在 3.4 节 介 绍 ) 只 能 实现 段 内 转移 。 无 条 件 转移 指令 和 过 程 
调用 及 返回 指令 既 可 以 是 段 内 转移 ,也 可 以 是 段 间 转移 。 软 中 断 指 令 和 中 断 返 回 指令 一 定 是 
段 间 转 移 ,将 在 后 面 的 章节 中 介绍 。 

对 无 条 件 转移 指令 和 过 程 调用 指令 而 言 , 按 给 出 转移 目的 地 址 的 方式 不 同 , 还 可 分 为 直接 
转移 和 间接 转移 两 种 。 在 转移 指令 中 直接 给 出 转移 目的 地 址 的 转移 称 为 直接 转移 。 在 转移 指 
令 中 没有 直接 给 出 转移 目的 地 址 ,但 给 出 了 包含 转移 目的 地 址 的 寄存 器 或 者 存储 单元 ,这 样 的 
转移 称 为 间接 转移 。 

2. 无 条 件 转移 指令 

如 上 所 述 ,无 条 件 转移 指令 可 分 为 4 种 : 段 内 直接 转移 、 段 内 间接 转移 、 段 间 直 接 转移 和 
段 间 间接 转移 。 无 条 件 转移 指令 均 不 影响 标志 寄存 器 中 的 状态 标志 。 

(1) 无 条 件 段 内 直接 转移 指令 。 在 2. 6. 4 节 介绍 的 无 条 件 转移 指令 就 是 段 内 直接 转移 指 
令 。 这 是 用 得 最 多 的 无 条 件 转移 指令 ,在 前 面 章节 的 示例 中 ,已 经 多 次 用 到 。 该 指令 的 书写 格 
式 如 下 : 

Jp WH 


标号 LABEL 用 于 表示 转移 的 目标 位 置 .或 者 说 转移 目的 地 。 
无 条 件 段 内 直接 转移 指令 的 对 应 机 器 指令 由 操作 码 和 地 址 差 值 两 部 分 组 成 ,其 格式 如 
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图 3.7 所 示 。 开 始 部 分 是 无 条 件 段 内 直接 转移 指令 的 操作 码 , 随 后 有 若干 个 字 节 表示 的 地 址 
差 值 。 





[操作 友 oP | 。 地址 差 ml 








图 3.7 相对 转移 指令 机 器 码 的 格式 


这 里 的 地 址 差 rel, 是 转移 目标 地 址 偏 移 (标号 LABEL 所 指定 指令 的 地 址 偏 移 ) 与 紧 随 
JMP 指令 的 下 一 条 指令 的 地 址 偏 移 之 间 的 差 值 。 汇 编 器 在 汇编 过 程 中 可 以 计算 出 地 址 差 
rel。 因 此 ,在 执行 无 条 件 段 内 直接 转移 指令 时 ,实际 的 动作 是 把 指令 中 的 地 址 差 rel 加 到 指令 
指针 寄存 器 EIP 上 ,使 EIP 的 内 容 为 转移 目标 地 址 偏 移 , 从 而 实现 转移 。 

无 条 件 段 内 直接 转移 指令 中 的 地 址 差 rel 可 用 8 位 (一 个 字 节 ) 表 示 , 也 可 用 32 位 (4 个 字 
节 ) 或 者 16 位 (2 个 字 节 ) 来 表示 。 如 果 只 用 8 位 表示 地 址 差 , 就 称 为 短 (short) 转 移 ; 否则 就 
称 为 近 (near) 转 移 。 由 于 差 值 是 一 个 有 符号 数 ,因此 无 条 件 转移 指令 可 以 实现 向 前 方 ( 未 来 ) 
转移 ,也 可 以 实现 向 后 方 (过 往 ) 转 移 。8 位 表示 的 地 址 差 的 范围 为 一 128 一 十 127, 转 移 的 范围 
比较 有 限 。 在 保护 方式 下 (32 位 代码 段 ) ,地 址 差 也 可 以 用 32 位 来 表示 ,这 样 就 可 以 转移 到 段 
内 的 任何 有 效 目 标 地 址 。 

这 种 利用 目标 地 址 与 转移 指令 所 处 地 址 之 间 的 差 值 来 表示 转移 目标 地 址 的 转移 方式 , 称 
为 相对 转移 。 相 对 转移 有 利于 程序 的 浮动 。 

如 果 当 汇编 器 汇编 到 某 条 转移 指令 时 能 够 正确 地 计算 出 地 址 差 rel ,那么 汇编 器 就 根据 地 
址 差 的 大 小 ,决定 采用 8 位 表示 ,还 是 采用 32 位 (或 者 16 位 ) 表 示 。 和 否则 ,汇编 器 可 能 会 用 较 
多 的 位 数 来 表示 地 址 差 。 如 果 程 序 员 在 写 程序 时 能 估计 出 用 8 位 就 可 以 表示 地 址 差 ,那么 可 
在 标号 前 加 一 个 汇编 器 操作 符 "SHORT”。 在 前 面 许多 示例 的 目标 代码 中 ,经 常 出 现 的 符号 
“SHORT”, 就 是 表示 转移 目的 地 就 在 附近 ,用 一 个 字 节 就 可 以 表示 地 址 差 。 

(2) 无 条 件 段 内 间接 转移 指令 。 无 条 件 段 内 间接 转移 指令 的 使 用 格式 如 下 : 

Jp PD 


该 指令 使 控制 无 条 件 地 转移 到 由 操作 数 OPRD 的 内 容 给 定 的 目标 地 址 处 。 在 保护 方式 
下 (32 位 代码 段 ) ,OPRD 是 32 位 通用 寄存 器 或 者 双 字 存储 单元 ,其 内 容 直接 被 装 人 指令 指针 
寄存 器 EIP, 从 而 实现 转移 。 
【 例 3-41】 如 下 指令 演示 了 无 条 件 段 内 间接 转移 指令 的 使 用 ,这 仅仅 是 个 示例 。 
JP EX ;目标 地 址 是 EX 寄存 器 的 内 容 
JWP DWRD PTR [EEX] ;目标 地 址 是 由 E 虹 所 指向 的 双 字 存储 单元 内 容 
【 例 3-42】 如 下 C 语言 程序 dp318 演示 无 条 件 段 内 转移 指令 的 使 用 。 
#include < stdio.h> 
char flagf='0', flag2'0', flag$='0'; 


int ptonext; /存放 转移 地 址 
int mair() 
{ 
_asn{ 
LEA EM STEP2 /取得 第 二 步 的 开始 地 址 


MN ptonext，EAX /保存 到 存储 单元 
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LEA EX STEPI // 取 得 第 一 步 的 开始 地 址 

JP EX /转移 到 第 一 步 ( 段 内 间接 转移 ) 
SrEp2: 

MY flagz 'B 

JP SP3 /转移 到 第 三 步 ( 段 内 直接 转移 ) 
STEP1: 

MV flagl, 'A' 

JP ”ptonext /转移 到 第 二 步 ( 段 内 间接 转移 ) 
SrEpa: 

MY flag3 'C' 


} 
printk" %c,%c,%o\n" ,flagl, flag2 flag3) ; /显示 为 ABC 
return 0; 

] 

上 述 程序 dp318 的 嵌入 汇编 代码 部 分 ,演示 了 通过 寄存 器 或 存储 单元 实现 无 条 件 段 内 间 
接 转移 ,也 再 次 演示 了 无 条 件 段 内 直接 转移 。 

(3) 无 条 件 段 间 转移 指令 。 无 条 件 段 间 直接 转移 指令 的 使 用 格式 与 上 述 的 无 条 件 段 内 直 
接 转 移 指令 相 类 似 ,无 条件 段 间 间 接 转移 指令 的 使 用 格式 和 上 述 的 无 条 件 段 内 间接 转移 指令 
相 类 似 。 但 由 于 涉及 改变 代码 段 寄存 器 CS 的 内 容 , 因 此 较为 复杂 ,将 在 第 6 章 和 第 9 章 中 
介绍 。 

3. 条 件 转移 指令 

在 2.6.2 节 中 对 条 件 转移 指令 进行 过 介绍 , 列 出 了 所 有 条 件 转移 指令 。 

虽然 条 件 转移 指令 通常 根据 标志 寄存 器 中 的 状态 标志 来 判断 条 件 是 否 满足 ,但 条 件 转移 
指令 本 身 的 执行 不 影响 状态 标志 。 条 件 转移 指令 只 局 限于 段 内 转移 。 

条 件 转移 指令 也 采用 相对 转移 方式 。 条 件 转移 指令 机 器 码 的 格式 如 图 3. 7 所 示 。 首 先是 
表示 各 种 条 件 转移 指令 的 操作 码 部 分 ,随后 有 若干 个 字 节 表示 EIP 的 当前 值 与 转移 目的 地 偏 
移 之 间 的 差 值 。 当 条 件 满足 时 ,就 把 这 个 差 值 加 到 EIP 上 ,从 而 使 EIP 等 于 标号 所 代表 的 偏 
移 , 这 样 , 取 下 一 条 指令 时 就 取出 标号 处 的 指令 了 ,也 就 实现 了 转移 。 由 于 差 值 是 一 个 有 符号 
数 , 因 此 条 件 转 移 指 令 可 以 实现 向 前 方 (未 来 ) 转 移 , 也 可 以 实现 向 后 方 (过 往 ) 转 移 。 

条 件 转 移 指令 的 地 址 差 rel 可 用 8 位 (1 个 字 节 ) 表 示 , 也 可 用 32 位 (4 个 字 节 ) 表 示 ,或 者 
用 16 位 (2 个 字 节 ) 表 示 。 当 用 8 位 表示 地 址 差 时 ,表示 的 范围 为 一 128 一 十 127, 因 此 转移 的 
范围 比较 有 限 。 在 保护 方式 下 (32 位 代码 段 ) ,地 址 差 也 可 以 用 32 位 来 表示 ,这 样 条 件 转移 指 
令 就 可 以 转移 到 段 内 的 任何 有 效 目 标 地 址 。 

在 前 面 的 示例 中 ,已 经 多 次 使 用 了 多 种 条 件 转 移 指令 。 


3.3.3 多 路 分 支 的 实现 


当 根据 某 个 变量 的 值 , 进 行 多 种 不 同 处 理 时 ,就 产生 了 多 路 分 支 。 多 路 分 支 的 结构 如 
图 3.8 所 示 。 虽 然 任何 复杂 的 多 路 分 支 总 可 分 解 成 多 个 简单 分 支 , 但 基于 简单 分 支 实现 多 路 
分 支 效率 不 高 。 在 C 语言 中 ,常用 switch 语句 实现 多 路 分 支 。 在 汇编 语言 中 ,如 何 实现 多 路 
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分 支 呢 ?通过 无 条 件 间接 转移 指令 和 目标 地 址 表 来 实现 多 路 分 支 。 












































7 满足 条 件 1 满足 条 件 2 满足 条 件 n 
指令 序列 1 指令 序列 2 “es 指令 序列 " 


图 3.8 多 路 分 支 结构 示意 图 


【 例 3-43】 分 析 C 语言 中 switch 语句 的 实现 。 下 面 的 函数 cf319 根据 参数 operation 的 
值 进 行 不 同 的 处 理 , 利 用 switch 语句 实现 。 
int cf319 int x, int operation) 
{ 
int yi; 
/多 路 分 支 
Switch operation) { 
case 1: 
FRx 
break; 
case 2: 
txt 6; 


default: 
Ex; 
} 
if y> 1000) 
y 1000; 
retum y; 

} 

为 了 演示 switch 语句 的 实现 ,刻意 没有 安排 连续 的 case 值 ,虽然 从 1 开始 到 8, 但 中 间 缺 
少 了 3.6 和 7 的 情形 。 

如 果 采 用 编译 优化 选项 “使 速度 最 大 化 ”, 编 译 上 述 程 序 后 ,可 得 到 如 下 所 示 的 目标 代码 ， 
其 中 “DWORD PTR” 表 示 双 字 存 储 单元 ,“SHORT” 表 示 转 移 目 的 地 址 就 在 附近 ,只 需 用 一 
个 字 节 就 可 以 表示 地 址 差 。 

;函数 cf319 目 标 代码 





eax DWRD PTR [ebp+r 何 
eax 

eax 7 

SHORT LN2cf319 


DWORD PTR LNI2cf319[eaxk 4] 


eax DORD PTR [ebpr 引 
eax DNORD PTR [eaxr eaxk 刁 
SHORT LN7cf319 


eax DIORD PTR [ebpt B] 
eax, DIORD PTR [eaxr eaxk 少 可 
SHORT LN7cf319 


eax DWORD PTR [ebpr 引 
€ax, eax 
SHORT LN7cf319 


ecx, DWORD PTR [ebpr 引 
eax, DWORD PTR [ecxr 4] 
eax, ecx 

SHORT LN7cf319 


;建立 堆栈 框架 

;switcH operatio) { 

;取得 参数 operatial case 值 ) 
;从 0 开始 计算 ,所 以 先 减 去 1 
;从 0 开始 计算 ,最 多 就 是 7 
;超过 , 则 转 default 
;实施 多 路 分 支 [ae j 


;case 1: 
FR xi 


FR xt6; 


小 xX 人 x 


:if y> 1000) 


;FF 1000; 


iretum y; 
;撤销 堆栈 框架 
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LNI2cf319: ;多 向 分 支 目标 地 址 表 
D LNcf319 ;case 1 
D IN5cf3l9 ;case 2 
D LNcf319 ;default 
D LNMcf3l9 ;case 4 
D LNMcf3l9 ;case 5 
D Lcf319 :default 
D LNcf319 ;default 
D LN3cf3l9 icase 8 


把 上 述 目 标 代码 与 源 程序 对 比分 析 , 可 以 很 清楚 地 看 到 实现 各 路 分 支 的 具体 指令 。 与 
break 语句 对 应 的 是 一 条 无 条 件 转移 指令 ,由 它 跳 转 到 switch 语句 结束 处 。 

在 上 述 目 标 代码 中 ,指令 “jmp DWORD PTR LN12cf319[eax* 4]? 是 关键 的 一 条 指令 。 
它 实现 无 条 件 段 内 间接 转移 ,根据 case 值 ,转移 到 对 应 的 分 支 处 。 在 目标 代码 的 尾部 有 一 张 
目标 地 址 表 , 每 项 (4 个 字 节 ) 存 放 一 路 分 支 的 入 口 地 址 。 对 应 跳 空 case 值 的 “不 存在 ”分 支 , 安 
排 了 default 分 支 的 入 口 地 址 。 从 目标 代码 可 见 , 标 号 LN12cf319 是 该 目标 地 址 表 的 起 始 地 
址 偏 移 , 于 是 有 效 地 址 表达 式 LN12cf319[eax * 4], 表 示 目 标 地 址 表 中 的 某 一 项 的 有 效 地 址 。 
所 以 ,上 述 无 条 件 段 内 间接 转移 指令 jmp 的 执行 ,就 是 从 目标 地 址 表 中 取得 一 路 分 支 的 入 口 
地 址 送 到 EIP, 从 而 实现 转移 。 获 取 目 标 地 址 表 中 的 哪 一 项 由 寄存 器 EAX 决定 ,也 就 是 由 
case 值 决定 。 

当 多 路 分 支 在 5 路 以 上 时 ,可 以 考虑 利用 无 条 件 间 接 转移 指令 和 目标 地 址 表 来 实现 多 路 
分 支 , 这 种 实现 方法 既 方便 又 高 效 。 


3.4 循环 程序 设计 


当 需 要 重复 某 些 操作 时 ,就 应 该 考虑 使 用 循环 方式 。 循 环 结构 是 程序 的 基本 结构 之 一 , 通 
常 ,一 个 程序 总 会 包含 循环 。 本 节 先 结合 C 语言 实例 函数 的 目标 代码 介绍 实现 循环 的 基本 方 
法 ,然后 介绍 专门 的 循环 指令 ,最 后 介绍 多 重 循环 的 实现 。 


3.4.1 循环 程序 设计 示例 


循环 通常 由 4 个 部 分 组 成 : 初始 化 部 分 循环 体 部 分 、 调 整 部 分 、 控 制 部 分 。 各 部 分 之 间 
的 关系 如 图 3. 9 所 示 。 图 3. 9(a) 是 先 执行 后 判断 的 结构 ,图 3. 9(b) 是 先 判 断后 执行 的 结构 。 
有 时 这 4 个 部 分 可 以 简化 ,形成 互相 包含 交叉 的 情况 .不 一 定 能 明确 分 成 4 个 部 分 。 
有 多 种 方法 可 实现 循环 的 控制 ,常用 的 有 计数 控制 法 和 条 件 控 制 法 等 。 
1. 先 执行 后 判断 的 示例 
在 C 语 言 中 ,do-while 循环 控制 语句 是 先 执 行 后 判断 的 。 
【 例 3-44】 分 析 如 下 C 语言 编写 的 函数 cf320 的 目标 代码 。 
int cf320 unsigned int n) 
{ 
inrt lerF 0; 
dof 
lenr+ ; 
rF 10; 
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} wilkgnEOo : 
retumn len ; 
] 
函数 cf320 的 功能 是 统计 无 符号 整数 作为 十 进 制 数 时 的 位 数 。 局 部 变量 len 用 于 存放 
整数 的 位 数 。 由 于 至 少 一 位 ,因此 采用 了 do-while 循环 结构 。 每 次 把 整数 除 以 10, 直 到 






























































为 0 结束 循环 。 
i 初始 化 部 分 
循环 体 部 分 
调整 部 分 循环 体 部 分 
1 
循环 条 件 满足 > 调整 部 分 
N 





王 -一 


(a) (b) 
图 3.9 循环 结构 示意 图 
假设 不 要 求 编 译 优化 , 即 采 用 编译 优化 选项 “已 禁用 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 
的 用 汇编 格式 指令 表示 的 目标 代码 。 其 中 ,“DWORD PTR” 表 示 双 字 存 储 单元 ,“SHORT” 表 
示 转 移 目 的 地 就 在 附近 ,分 号 之 后 是 添加 的 注释 。 
;函数 cf320 的 目标 代码 ( 不 采用 编译 优化 ) 


push ebp 
mov ep, ep :建立 堆栈 框架 
push ecx ;使 堆栈 指针 EP- 4 安排 局 部 变量 len 
mv DWRD PTR [ebp-4],0 ilerF 0; 
LN3cf320: ;dof 
;lenr+ ; 
mv eax, DWORD PTR [ebp- 习 
add eax 1 
FF 10; 


edx edx ; 因 n 是 无 符号 数 , 用 XR 指令 清 0 


ecx 
DWORD PTR [ebp+r 8], eax 
} whilén G0) ; 
ap DWRDPTR [ep+ 8], 0 
jne SHRT LN3cf3220 
;return len; 
mov eax, DNORD PTR [ebp- 本 ;准备 返回 值 
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mov esp, ep 
pp ep 
ret 


} 
撤销 局 部 变量 len 
撤销 堆栈 框架 


从 上 述 目标 代码 可 知 ,函数 cf320 不 仅 通过 堆栈 传递 参数 ,而且 还 在 堆栈 中 安排 了 局 部 变 
量 len。 如 同 在 3. 1. 3 中 的 介绍 ,在 建立 堆栈 框架 后 ,通过 一 条 push 指令 安排 局 部 变量 len 的 
存储 单元 。 这 样 存 储 单元 Lebp 一 4] 就 是 len ,存储 单元 Lebp 十 8] 是 形 参 ”。 

上 述 目标 代码 采用 如 图 3. 9(a) 所 示 的 循环 结构 。 这 个 循环 的 4 个 部 分 俱全 : 在 初始 化 部 
分 设置 len 的 初 值 ; 循环 体 部 分 比较 简单 ,只 是 增加 计数 ; 可 以 认为 计算 n/10 是 循环 调整 部 


分 的 内 容 ; 根据 n 是否 为 0, 控制 循环 。 


如 果 采 用 编译 优化 选项 “使 大 小 最 小 化 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 的 目标 代码 


(标号 稍 有 修饰 ) 。 


;函数 cf30 的 目标 代码 ( 采用 ' 使 大 小 最 小 化 " 编译 优化 选项 ) 


push ebp 
mov ebp, ep 


Xxor ECX, ecxX 
esi 


i: 


mov eax, DWRD PTR [ebpr 引 
push 10 

xor edx, edx 

pop esi 

div esi 


ret 


;EX 作为 len 
;lerF 0; 


在 使 用 I 之 前 ,保护 之 


:do{ 
;lent+; 
:rF 10; 


;准备 借助 堆栈 送 到 ESI 
;使 得 JE 0 
;使 得 Bl= 10 


} whilan =0); 
测试 n 是 否 为 2 


;return len ; 
;准备 返回 值 
恢复 El 

} 


从 上 述 目 标 代码 可 知 ,由 于 采用 了 “使 大 小 最 小 化 ”的 编译 优化 选项 ,因此 把 寄存 器 ECX 


作为 局 部 变量 len。 此 外 ,还 利用 指令 “push 


10” 和 “pop ”esi” 使 得 ESI 为 10, 虽 然 有 两 条 指 


令 ,但 机 器 码 的 字 节 数 却 要 少 。 巾 此 可 见 ,编译 器 是 “ 费 尽心 机 ”。 


2. 先 判断 后 执行 示例 一 


在 C 语言 中 ,while 循环 控制 语句 是 先 判断 后 执行 的 。 
【 例 3-45】 分 析 如 下 C 语言 编写 的 函数 cf321 的 目标 代码 。 
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int cf32K char * str) 
{ 
char * pc= str; 
whilg * pe) 
pott; 
retum (pcr str) ; 
} 
函数 cf321 的 功能 是 测量 字符 串 str 的 长 度 。 局 部 变量 pc 是 字符 型 指针 变量 ,指向 字符 
串 中 的 字符 。 字 符 串 可 能 为 空 串 ,所 以 采用 while 循环 结构 。 依 次 逐一 检查 字符 串 中 的 字符 ， 
如 果 没 有 遇 到 结束 标记 (0) ,就 调整 指针 ,否则 结束 循环 。 
假设 不 要 求 编译 优化 , 即 采用 编译 优化 选项 “已 禁用 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 
的 目标 代码 。 
;函数 cf221 的 目标 代码 ( 不 采用 编译 优化 ) 





push ebp 
mov ep, ep ;建立 堆栈 框架 
push ecx ;安排 局 部 变量 pe 
;pc= str; 
mov eax, DORD PTR [ebp+ 引 ;取得 str 
mv DWORD PTR [ebp- 4], eax ; 送 到 pc 
LN2cf221: 
mhile * 
mv ecx, DNORD PTR [ebp- 习 ;取得 pe 
movsx edx, BYTE PTR [ecx] :DX * pc 
test edx, edx 浏 断 所 指向 的 字符 是 否 为 结束 标记 
je SHORT LMicfa21 ; 遇 到 结束 标记 , 则 跳 转 
pott; 
add eax 1 
mv DWORD PTR [ebp- 4], eax 
Jjmp SHORT LN2cf321 :无条件 跳 转 Ma j 
LNIcf221: 
‘returr( po- str) ; 
mov eax DWORD PTR [ebp- 4 
} 
mov esp, dp ;撤销 局 部 变量 pc 
pp ep 撤销 堆栈 框架 


在 上 述 目标 代码 中 ,采用 与 例 3-44 目标 代码 中 相同 的 方法 ,在 堆栈 中 安排 了 局 部 变量 pe。 
这 样 存储 单元 [ebp-4] 就 是 pc, 存 储 单元 Lebp 十 8] 是 形 参 str。 值 得 指出 ,由 于 pc 是 指针 变量 ， 
因此 把 其 值 作为 地 址 ,才能 取得 它 所 指向 的 字符 。 采 用 了 符号 扩展 传送 指令 movsx, 既 取出 
pc 所 指向 的 字 节 值 ,又 进行 符号 扩展 。 随 后 的 指令 "test ”edx,edx” 作 用 是 测试 寄存 器 EDX 
是 否 为 0, 它 通过 自身 相 与 操作 来 影响 状态 标志 。 

上 述 目标 代码 采用 如 图 3. 9(b) 所 示 的 循环 结构 。 在 注释 带 有 //@j 行 中 的 无 条 件 转移 指 
令 很 重要 ,在 执行 完 循环 体 后 , 跳 转 上 去 ,判断 循环 条 件 是 否 满足 ,是 否 需要 继续 循环 。 这 里 的 
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循环 结束 条 件 是 遇 到 字符 串 尾 (字符 串 结 束 标记 0) 。 
类 似 于 例 3-44, 如 果 采 用 编译 优化 选项 “使 大 小 最 小 化 ”编译 上 述 程序 后 ,可 得 到 如 下 所 
示 的 目标 代码 。 
;函数 cf221 的 目标 代码 ( 采用 ' 使 大 小 最 小 化 " 编译 优化 选项 ) 


push ep 

mov ep, ep :建立 堆栈 框架 

mv ecx, DWRD PTR [ebpr 引 ;取出 str 存放 到 EX 

mhile * pe) 

ap BYEPIR [ecx], 0 浏 断 首 字符 是 否 为 结束 标记 

mov eax, ecx ;pc= str; 

je SHORT LMicf321 ;如 果 遇 结束 标记 ,结束 循环 
LL2cf321: 

inc eax ;pcr+ ; 

ap BYTE PTR [eaxj, 0 hilg * pe) 

jne SHORT LL2cf321 ;如 果 未 遇 结 束 标记 ,继续 循环 
LNIcf321: ;returr( pcr str) ; 

Sub eax, ecx 

pp ep } 

ret 


从 上 述 目 标 代码 可 知 ,由 于 采用 了 “使 大 小 最 小 化 ”的 编译 选项 ,cf321 的 目标 代码 没有 在 
堆栈 中 安排 局 部 变量 ,而 直接 采用 寄存 器 EAX 作为 局 部 变量 pc。 特别 是 有 两 处 判断 循环 条 
件 是 否 满足 ,第 一 处 的 判断 仅 进行 一 次 ,只 是 判断 首 字符 是 否 为 字符 串 结 束 标记 。 这 样 做 可 以 
避免 使 用 一 条 无 条 件 转 移 指 令 ( 见 上 述 无 编译 优化 生成 的 目标 代码 中 注释 带 //@j 标记 的 行 ) 。 

3. 先 判断 后 执行 示例 二 

在 C 语言 中 ,for 循环 控制 语句 也 是 先 判断 后 执行 的 。 

【 例 3-46】 分 析 如 下 C 语言 编写 的 函数 cf322 的 目标 代码 。 

int cf322 int arr[ ] ,int n) 

int isunF 0; 

for i=0; i<n; i+Hh 
sumt = arr[ 站; 
retum sumn ; 

} 

函数 cf322 的 功能 是 计算 一 个 整 型 数组 中 元 素 的 平均 值 。 数 组 和 元 素 的 个 数 作为 人口 参 
数 。 安 排 了 局 部 变量 i 和 sum, 其 中 i 是 循环 控制 变量 ,sum 用 于 统计 元 素 值 之 和 。 

假设 不 要 求 编译 优化 , 即 采 用 编译 优化 选项 “已 禁用 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 
的 目标 代码 。 

;函数 cf32 的 目标 代码 ( 不 采用 编译 优化 ) 


push ebp 

mov ebp, ep ;建立 堆栈 框架 
sb esp,8 :安排 局 部 变量 
mv DWFRD PTR [ebp-8], 0 ;sunF 0; 


;for =0; i<n; it 
mov DWRD PIR [ep-4,0 
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jm SHRT LN3cf322 ://@ jl 
LN2cf322: ;调整 循环 变量 i 
mv eax, DWORD PIR [ebp- 习 
add eax 1 
LN3cf322: ;比较 i 与 n 
mv ecx, DWRD PTR [ebp- 习 
am ecx, DMORD PTR [ebpt 僻 
jge SHRT LNicf322 ;如 果 i 不 小 于 n, 则 结束 循环 
;sumt = arr[ i 站; 
mv edx, DIORD PTR [ebp- 习 ;取得 变量 i 值 
mov eax, DORD PTR [ebp+ 8 ;取得 参数 ( 数组 首 元 素 地 址 ) 
mov ecx, DWORD PTR [ebp- 8] ;取得 变量 sm 值 
add 。 ecx，DWORD PIR [eaxt edxt 4] 加 
mv DNFD PTR [ebp- 8], ecx ;保存 到 变量 sm 
jmp SHRT LNDcf322 ;Ma j2 
LNIcf322: ;return sumn ; 
mv eax, DWRD PTR [ebp- 引 
od ;符号 扩展 到 EX 4 位 被 除数 ) 
idiv DWORD PTR [ebp+ 12] : 除 ,所 得 商 在 E 坟 中 
mov esp, ep ;撤销 局 部 变量 
pp ep 恢复 轨 
的 起 加 部 分 
从 上 述 目标 代码 可 知 , 它 也 是 先 判断 后 执行 ,代码 的 组 织 结 
构 如 图 3. 10 所 示 ,与 图 3. 9(b) 有 所 不 同 。 只 安排 了 一 处 循环 条 
件 的 判断 ,所 以 先 利用 无 条 件 转移 指令 ( 见 注释 带 //@jl 的 行 ) 网 星 邦 个 
直接 跳 转 到 循环 条 件 判 断 处 。 如 果 需 要 循环 , 则 执行 循环 体 ,之 
后 利用 无 条 件 转移 指令 ( 见 注释 带 //@j2 的 行 ) 跳 转 ,调整 循环 一 二 
变量 。 TY 
类 似 于 例 3-44 和 例 3-45, 也 可 以 采用 编译 优化 选项 “使 大 循环 体 部 分 
小 最 小 化 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 的 目标 代码 。 
;函数 cf32 的 目标 代码 (采用 ' 使 大 小 最 小 化 " 编译 优化 1 
选项 ) 图 3.10 先 判断 后 执行 的 另 
push ebp 一 种 组 织 形式 
mov ep, ep :建立 堆栈 框架 
Xor ecx, ecx IE= 0 
xor eax, eax ;SunF 0; 
i<n? 
amp DNORD PTR [ebp+r 12], ecx ;比较 n 与 i 
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jle ”SHORT LNicf32 ;如 果 n<= i, 则 结束 循环 
LL3cf322: 

;sumt = arr[ i ; 

mv edx, DWRD PTR [ebpt @] ;EX 指向 数组 首 元 素 

add eax, DWORD PIR [edxr ecxt 4] ;EDX+ EX 4 指向 第 i 个 元 素 
it+ 

Iinc ecx 
ii<n? 


amp ecx, DWORD PIR [ebp+ 12] 


jl SHORT UL3cf32 ;如 果 i<n, 则 继续 循环 
LNicf322: 
;return sumn ; 
odq 
idiv DWORD PTR [ebp+ 12] 
pp ep 恢复 虹 
ret ;返回 


从 上 述 目 标 代 码 可 知 ,由 于 采用 了 “使 大 小 最 小 化 ”的 编译 选项 ,cf322 的 目标 代码 没有 在 
堆栈 中 安排 局 部 变量 ,而 直接 采用 寄存 器 ECX 和 EAX 分 别 作为 局 部 变量 i 和 sum。 此 外 , 通 
过 安排 两 处 判断 循环 条 件 是 否 满足 ,避免 了 两 条 无 条 件 转移 指令 。 


arr 
EDX EDX+ECX*4 


0 1 2 上 n-l 























图 3.11 访问 数组 元 素 示意 图 


从 上 述 目 标 代码 还 可 知 ,虽然 源 程序 中 函数 cf322 的 一 个 形 参 是 数组 ,但 调用 过 程 中 实际 
传递 的 就 是 指针 ,也 就 是 地 址 。 在 堆栈 的 LEBP 十 8] 单 元 中 ,存放 的 是 由 主 调 函 数 在 调用 前 压 
入 堆栈 的 数组 首 元 素 的 地 址 。 图 3. 11 给 出 了 存 取 数组 元 素 的 示意 图 ,每 一 个 存储 单元 为 4 个 
字 节 ,因为 整 型 数 占 用 4 个 字 节 。 


3.4.2 循环 指令 


利用 条 件 转移 指令 和 无 条 件 转移 指令 可 以 实现 循环 ,但 为 了 更 加 方便 地 实现 循环 ,IA-32 
系列 CPU 还 专门 提供 了 循环 指令 。 

1. 循环 指令 

循环 指令 类 似 于 条 件 转移 指令 ,不 仅 属 于 段 内 转移 ,而 且 还 采用 相对 转移 的 方式 , 即 通 过 
在 指令 指针 寄存 器 EIP 上 加 一 个 地 址 差 的 方式 实现 转移 。 需 要 注意 ,循环 指令 中 只 用 一 个 字 
节 (8 位 ) 表 示 地 址 差 , 所 以 循环 转移 的 范围 仅 为 一 128 一 十 127。 

在 保护 方式 (32 位 代码 段 ) 下 ,循环 指令 将 自动 以 寄存 器 ECX 作为 循环 计数 器 。 

循环 指令 不 影响 各 标志 。 
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(1) 计数 循环 指令 (LOOP) 。 计 数 循环 指令 的 格式 如 下 : 
LOP MH 
这 条 指令 使 寄存 器 ECX 的 值 减 1, 如 果 结 果 不 等 于 0, 则 转移 到 标号 LABEL 处 ,否则 顺 
序 执行 LOOP 指令 后 的 指令 。 
这 条 指令 类 似 于 如 下 的 两 条 指令 : 
DEC Ex 
JZ Ug 
通常 在 利用 LOOP 指令 构成 循环 时 , 先 要 设置 好 计数 器 ECX 的 初 值 , 即 循环 次 数 。 由 
于 首先 进行 寄存 器 ECX 减 1 操作 ,再 判断 结果 是 否 为 0, 因此 循环 最 多 可 进行 2 的 32 次 
方 次 。 
【 例 3-47】 如 下 代码 片段 统计 寄存 器 EAX 中 位 是 1 的 个 数 ,统计 结果 存放 在 寄存 器 
EDX 中 。 假 设 EAX=000023F6H ,那么 有 9 个 位 是 1: 


XR EX EX ; 清 EX 
MW EX 22 ;设置 循环 计数 
LAB1: 
SR EMX1 : 布 移 一 位 ( 最 低位 进入 进位 标志 CF) 
MW D0 ;统计 ( 实际 是 加 0F) 
LOP LAB1 ;循环 


对 于 循环 次 数 已 知 的 循环 ,利用 循环 指令 ,能 够 更 加 简明 高 效 。 
(2) 等 于 /全 零 循 环 指令 (LOOPE/LOOPZ) 。 等 于 /全 零 循 环 指令 有 两 个 助 记 符 , 格 式 如 下 : 
LOPE AH. 
LOF7 AH 
这 条 指令 使 寄存 器 ECX 的 值 减 1, 如 果 结 果 不 等 于 0, 并且 零 标志 ZF 等 于 1( 表 示 相 等 )， 
那么 就 转移 到 标号 LABEL 处 ,否则 顺序 执行 。 注 意 指 令 本 身 实施 的 寄存 器 ECX 减 1 操作 并 
不 影响 标志 。 
【 例 3-48】 如 下 代码 片段 实现 在 一 个 字符 数组 中 查找 第 一 个 非 空格 字符 ,假设 字符 数组 
buff 的 长 度 为 100。 


LEA EX buff ;指向 字符 数组 首 

WwW Ex 100 人 

WW AL 20H ;空格 字符 

DEC EX ;为 了 简化 循环 , 先 减 1 
LAB2: 

INC EX ;调整 到 指向 当前 字符 

QP A [EX] ;比较 

LOOPE LAB2 浏 断 和 循环 计数 同时 进行 


(3) 不 等 于 / 非 零 循环 指令 (LOOPNE/LOOPNZ) 。 不 等 于 / 非 零 循环 指令 也 有 两 个 助 记 
符 ,格式 如 下 : 


LORE MEE 
LORE AH 


这 条 指令 使 寄存 器 ECX 的 值 减 1, 如 果 结 果 不 等 于 0, 并且 零 标志 ZF 等 于 0( 表 示 不 相 
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等 ) ,那么 就 转移 到 标号 LABEL 处 ,否则 顺序 执行 。 注 意 指令 本 身 实 施 的 寄存 器 ECX 减 1 操 


作 不 影响 标志 。 


【 例 3-49】 如 下 C 程序 dp323 及 其 垦 入 汇编 代码 ,演示 LOOPNE 指令 的 使 用 。 利 用 髓 
入 汇编 代码 测量 由 用 户 输入 的 字符 串 的 长 度 。 


#include < stdio.h> 
int mair() 
{ 
char string[ 100] ; 
int len; 


printk” Input string:”) ; 


scanf" %s" ,strirg) ; 
1/ 职 入 汇编 代码 
_asm{ 
LEA BEI, string 
XR EX EX 
XR 人 LAL 
DE BI 


INC BI 

QP AL [0] 
LOOPNE LB3 
NT EX 

MY lan EX 


printfk" ler=% d\n" ,len) ; 


return 0; 
} 


WU 用 于 存放 字符 串 
V 用 于 存放 字符 串 长 度 


/由 用 户 输入 一 个 字符 串 
/使 得 印 | 指向 字符 串 

/假设 字符 串 ' 无 限 长 " 

/使 A=Q 字符 串 结 束 标记 ) 
/为 了 简化 循环 , 先 减 1 
/指向 待 判断 字符 
/是 否 为 结束 标记 

/如 果 不 是 结束 标记 ,继续 循环 


/根据 蚁 推断 字符 串 长 度 


/显示 输入 字符 串 的 长 度 


在 上 述 演示 程序 dp323 的 戏 入 式 汇编 代码 中 ,利用 LOOPNE 指令 控制 循环 ,每 次 循环 调 
整 指针 和 判断 是 否 遇 到 字符 串 结束 标记 。 在 循环 开始 前 ,把 循环 计数 器 ECX 清 为 0, 相当 于 
假设 字符 串 “ 无 限 长 ”。 由 于 LOOPNE 指令 每 次 减 1, 因 此 ECX 就 隐 含 了 循环 的 次 数 ,这样 就 
可 以 根据 ECX 的 值 简单 推算 出 字符 串 的 长 度 。 


2. 计数 器 转移 指令 


如 上 所 述 ,循环 指令 把 寄存 器 ECX 作为 循环 计数 器 ,如 果 循 环 计 数 器 的 初 值 为 0, 意味 着 
要 进行 2 的 32 次 方 的 循环 。 但 普通 程序 中 ,如 果 循环 次 数 为 0, 往 往 表示 不 进行 循环 。 为 此 ， 
IA-32 系列 CPU 还 提供 了 一 条 把 ECX 是 否 为 0 作为 判断 条 件 的 条 件 转移 指令 , 称 为 计数 器 


转移 指令 。 


计数 器 转移 指令 的 格式 如 下 : 


EX ME 


该 指令 实现 当 寄存 器 ECX 的 值 等 于 0 时 转移 到 标号 LABEL 处 ,否则 顺序 执行 。 
循 


通常 在 


环 开始 之 前 使 用 该 指令 ,所 以 当 循 环 次 数 为 0 时 ,就 可 以 跳 过 循环 体 。 
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【 例 3-50〗 如 下 C 程序 dp324 演示 通过 堆栈 传递 参数 调用 子 程序 和 指令 JECXZ 的 使 
用 。 主 程序 的 功能 是 计算 由 用 户 输入 的 若干 成 绩 的 平均 值 。 它 调用 子 程序 完成 平均 值 的 计 
算 。 子 程序 的 功能 及 原型 与 例 3-46 中 函数 cf322 相同 。 

#include < stdio.h> 


# define ONT 5 /假设 成 绩 项 数 

int mair() 

{ 
int score[ OOUNT] ; /用 于 存放 由 用 户 输入 的 成 绩 
int i, average; 
for i=0; i< O0NT; it { /由 用 户 从 键盘 输入 成 绩 


printfk" score[%d]=" , i) ; 
scanf" %d" ，&score[ 门 ) ; 
} 


/调用 子 程序 计算 成 绩 平均 值 

_asn{ 
LEA EAX score 
PUSH OOUNT // 把 数组 长 度 压 入 堆栈 
PUSH EX /把 数组 起 始 地 址 压 人 堆栈 
OL AR /调用 子 程序 
AD ESP 8 / 主 衡 堆栈 


MV average, EX 
j 
Pi 
printR"” average=%d 中 n”,average) ; /显示 所 得 平均 值 


return 0; 
/ 季 程 序 AER 
_asm{ 
MR: /于 程序 入口 
RH EP 
WW Ep, EP /建立 堆栈 框架 
MV EX [EEP+ 伞 /取得 数组 长 度 
MW EX [EBP+ 引 /取得 数组 起 始 地 址 
XR EM EX /将 电 作 为 和 sm 
XR EX EX /将 轧 作 为 下 标 i 
JEOC WFR /如 数组 长 度 为 0, 不 循环 累加 
NEXT: 
ADD EMX [EDXr EBX] /累加 
INC EX /调整 下 标 i 
LOP NEXT // 咸 计数 方式 控制 循环 
CDQ /计算 平均 值 
IDIV DORD PTR [EBP+ 僻 


POP EP 1/ 后 销 堆栈 框架 
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FET /返回 


] 

从 上 述 代码 可 知 , 子 程序 在 建立 堆栈 框架 后 ,从 堆栈 中 取得 数组 长 度 并 送 到 寄存 器 ECX， 
随后 采用 计数 器 转移 指令 JECXZ 检查 数组 元 素 个 数 是 否 为 0, 如 果 ECX 为 0 就 不 实施 循环 
累加 。 与 函数 cf322 的 目标 代码 比较 可 知 ,这 里 的 代码 更 可 靠 , 同 时 效率 也 稍 高 。 

3. 应 用 示例 

【 例 3-51】 编写 一 个 代码 片段 ,把 32 位 二 进 制 数 转换 为 10 位 十 进 制 数 的 ASCII 码 串 。 
为 了 简单 化 , 设 二 进 制 数 是 无 符号 的 。 

在 C 语言 中 ,如 果 和 希望 采用 十 进 制 数 的 形式 输出 一 个 无 符号 整 型 变量 uintx 的 值 ,可 以 利 
用 如 下 的 语句 : 

printfk" % Un® , uintx) ; 

事实 上 ,由 C 语言 的 库 函 数 printf 实现 了 二 进 制 数 到 十 进 制 数 的 转换 。 假 设 不 准 使 用 输 
出 无 符号 整 型 的 格式 符 "%u" ,只 准 使 用 输出 字符 串 的 格式 符 "%s" ,那么 怎么 办 ? 本 例 的 要 求 
是 直接 用 汇编 代码 来 实现 转换 。 设 已 有 如 下 的 C 程序 dp325 框架 ,现在 需要 编写 中 间 部 分 的 
汇编 代码 片段 : 


/演示 程序 5 框架 
#include < stdio.h> 
int mair() 
和 
unsigned uinbe 56789123; /无 符号 整 型 变量 
char buffer[ 1 ; /用 于 存放 ASCII 码 串 的 缓冲 区 
_asm{ 
/实现 转换 的 汇编 代码 片段 
printRk" % s\n" , buffer) ; /输出 字符 串 
retum 0; 


] 

把 一 个 整数 除 以 10, 所 得 的 余数 就 是 个 位 数 。 如 果 把 所 得 的 商 再 除 以 10, 所 得 的 余数 就 
是 十 位 数 。 如 果 继续 把 所 得 的 商 除 以 10, 所 得 的 余数 就 是 百 位 数 。 以 此 类 推 ,就 可 以 得 到 一 
个 整数 的 各 位 十 进 制 数 了 。32 位 二 进 制 数 能 表示 的 最 大 十 进 制 数 只 有 10 位 ,所 以 循环 地 除 
上 10 次 ,就 可 以 得 到 各 位 十 进 制 数 。 

为 了 把 一 位 十 进 制 数 转换 为 对 应 的 ASCII 码 ,只 要 加 上 数字 符 '0' 的 ASCII 码 。 

由 于 先 得 到 个 位 数 ,然后 得 到 十 位 数 ,再 得 到 百 位 数 ,因此 在 把 所 得 的 各 位 十 进 制 数 的 
ASCII 码 存放 到 字符 串 中 时 ,要 从 字符 串 的 尾部 开始 。 图 3. 12 给 出 了 ASCII 码 串 的 存储 示 
意图 ,其 中 每 一 字 节 的 数据 是 十 六 进 制 表 示 的 ASCII 码 。 

对 应 的 代码 片段 as326 如 下 : 

汇编 代码 片段 as326 

_asm{ 

LEA ESI, buffer ;获取 存放 字符 串 的 缓冲 区 首 地 址 
MOV EMX uintx ;取得 待 转换 的 数据 





MW ”EX 10 ;循环 次 数 ( 十 进 制 数 的 位 数 ) 
MV EX10 证 进 制 的 基数 是 10 
NEXT: 
XR EX EDX 形成 位 的 被 除数 ( 无 符号 数 除 ) 
DIV EX ; 除 以 10, EE 以 含 商 , BX 含 余 数 
AD DL '0 ;把 十 进 制 位 转 成 对 应 的 ASCN 码 
MV [ESIt EX-1, DL ;保存 到 缓冲 区 
LP NET ;计数 循环 
MV BYTE PTR [ESI+ 10],0 ;设置 字符 串 结束 标志 


} 
在 上 述 代 码 片段 中 ,由 于 总 是 循环 10 次 ,因此 转换 所 得 的 ASCII 字符 串 可 能 在 前 端 有 若 
干 个 字符 '0'。 


| 时 依次 存放 ESI+ECX-1 
ESI 


2 
<4=—====. 1 


36| 37| 38| 39|31|32|33|00 






































0 0 人 6 六 8 9 1 2 3 
图 3.12 ASCII 码 串 的 存储 示意 图 
【 例 3-52】 深化 例 3-51。@ 设 二 进 制 数 是 有 符号 的 ,如 果 是 负数 , 则 所 得 字符 串 的 第 一 
个 字符 应 该 是 负 号 ; @ 不 需要 前 端 可 能 出 现 的 '0'。 
设 变 量 intx 和 存放 字符 串 的 缓冲 区 定义 如 下 : 
irt inbe ~ 57312; 


char buffer[10] ; /足够 长 
满足 所 需要 求 的 代码 片段 as327 如 下 所 示 
汇编 代码 片段 as37 
_asm{ 
LEA ESI, buffer ; 置 指 针 初 值 
WW EM intx ;取得 待 转换 的 数据 
qP EX 0 浏 断 待 转换 数据 是 否 为 负数 
JE LBl 非 负数 , 跳 转 
MY BYEPTR [ESD, ~ ， ; 先 保存 一 个 负 号 
IN ESI ;调整 指针 
NEG EX ; 取 相 反 数 ,得 正 数 
LAB1: 
MV EX 10 :最 多 循环 0 次 
WwW EX10 ;每 次 除 以 10 
MV Bl, 0 ; 置 有 效 位 数 的 计数 器 初 值 
NEXT1: 
XR EX EX 
DIV ;获得 一 位 十 进 制 数 
PUSH EX ;把 所 得 一 位 十 进 制 数 压 入 堆栈 //@1 
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IN Bl ;有 效 位 数 增 加 1 

R 下 ;测试 结果 ( 商 ) 

LOOPNE NEXT1 ;如 结果 不 为 0, 考 虑 继续 循环 //@ 2 

My EX EI ; 置 下 一 个 循环 的 计数 
NEXT2: 

POP ;从 堆栈 弹出 余数 Ma3 

AD DLL '0 ; 转 成 对 应 的 ASCN 码 

MV [ED,n :依次 存放 到 缓冲 区 

IN EI 

LOOP ”NEXT2 ;循环 处 理 下 一 位 

My BYIE PTR [ESH, 0 :设置 字符 串 结束 标志 


} 

从 上 述 程 序 片 段 可 知 , 在 开始 转换 之 前 , 先 判 断 待 转 换 的 数据 是 否 为 负 , 如 果 是 负数 , 先 使 
得 字符 串 的 第 一 个 字符 为 负 号 ,同时 取 相 反 值 ,这 样 待 转换 数据 就 变 成 正 数 了 。 

代码 片段 含有 两 个 循环 。 第 一 个 循环 通过 循环 除 以 10 的 方法 ,取得 十 进 制 数 的 各 位 数 
值 ,但 是 循环 结束 的 方式 有 所 改变 ( 见 带 //@2 的 行 ) ,不仅 最 多 循环 10 次 ,而 且 只 有 结果 ( 表 
示 需 要 转换 的 数据 ) 不 为 0 时, 才 继续 循环 。 因 为 如 果 需 要 继续 转换 的 数据 为 0, 也 就 意味 着 
产生 前 端 没有 意义 的 0。 例 3-44 的 函数 cf320 就 是 这 个 思路 。 为 了 改变 存放 顺序 ,利用 了 堆 
栈 的 先进 后 出 特点 ,把 所 得 的 各 位 十 进 制 数 依次 压 入 堆栈 ( 见 带 //@1 的 行 ), 同 时 利用 寄存 器 
EDI 统计 压 人 堆栈 的 次 数 ,为 弹出 操作 做 好 准备 。 图 3. 13 给 出 了 压 人 堆栈 操作 后 的 堆栈 局 部 
示意 图 ,其 中 堆栈 的 每 一 项 是 32 位 (4 个 字 节 ) 。 

第 二 个 循环 比较 简单 ,依次 进行 弹出 操作 ,每 弹出 一 位 十 进 制 数 ,在 转换 成 对 应 的 ASCII 
后 ,就 依次 存 人 字符 串 。 第 二 个 循环 的 循环 次 数 是 压 人 堆栈 操作 的 次 数 ,也 就 是 十 进 制 数 的 有 
效 位 数 。 其 实 , 可 以 根据 第 一 个 循环 结束 时 寄存 器 ECX 的 值 ,来 得 到 压 入 堆栈 操作 的 次 数 ,这 
样 就 不 需要 专门 用 寄存 器 EDI 来 统计 了 。 


堆栈 底部 


0000 0002 
0000 0001 | 进 栈 方向 
0000 0003 

0000 0007 
ESP 一 = 0000 0005 | 出 栈 方向 


























图 3.13 把 各 位 十 进 制 数 压 和 堆栈 后 的 示意 图 


3.4.3 多 重 循环 设计 举例 
多 重 循环 就 是 循环 之 中 还 有 循环 。 
【 例 3-53】 如 下 C 函数 cf328 的 功能 是 .在 某 个 无 符号 整 型 数组 中 查找 第 一 个 特征 数据 ， 


新 概念 汇编 语言 





如 果 找 到 返回 下 标 值 (索引 号 ) ,否则 返回 一 1。 这 里 的 特征 是 指 在 用 二 进 制 表示 该 数据 时 ,其 


中 1 的 个 数 超过 20。 


int cf328 unsigned arr[ ]，int m) 


{ 

int i; 

unsigned value; 

int count= 0; 

for i=0; i<n; i+h 

t 
value= arr[ 站; 
if value <= 0Oxfffff) 

continue; 

count= 0; 
while value (=0) 
{ 


if value & ==1) 


Count++ ; 


value= value >> 1; 


| 
if cont > 20) 
break; 
} 
if count <= 20) 

=-1; 

retum i; 

} 


/循环 变量 

/用 于 判断 特征 值 

/统计 数据 中 1 的 个 数 

1/ 循环 遍历 数组 中 的 每 个 数据 


/Nxfffff 是 wD 位 1 的 最 小 值 
/如 不 超过 Qxfffff, 肯 定 不 是 特征 数据 
/统计 1 的 个 数 

1 测 最 低位 是 否 为 1 

1/ 向 右 移 一 位 


/找到 第 一 个 ,跳出 循环 


/如 没有 找到 特征 数据 ,返回 -1 


采用 编译 优化 选项 “使 大 小 最 小 化 ” ,编译 上 述 程 序 后 ,可 得 到 如 下 所 示 的 目标 代码 (标号 


稍 有 修饰 ) ,分 号 之 后 是 添加 的 注释 。 


;函数 cf3B8 的 目标 代码 ( 使 大 小 最 小 化 ) 


push ebp 
mov ebp, ep ;建立 堆栈 框架 
;for 语句 
xor eax, eax ;eax 作为 变量 i 
xor edx, edk ;ek 作为 变量 count 
ap DIORD PTR [ebp+ 12], eax ;比较 n 与 i 
jle SHORT LNi7cf328 ; 当 n<=i 时 , 跳 过 外 循环 
UL9cf328: ;外 循环 体 开 始 
;value= arr[ i ; 
mov ecx, DIORD PIR [ebpr 引 ;取得 作为 参数 的 数组 起 始 地 址 
mv ecx, DWRD PIR [ecxr eaxk 4 ; 取 第 i 项 数据 
iif value<= OxffffF continue; 
ap ecx 104855 
jbe SHRT LNBcf3228 


xor edx, edx 
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?hile 语句 
test ecx, ecx ;判断 value 是 否 为 0 
je SHORT LNBcf38 ;value 为 0, 跳 过 内 循环 
LL5cf328: ;内 循环 体 开始 
test cl 1 ;value & 仁 =1? 
je SHORT LN3cf328 
inc edx ;countt+ ; 
LN3cf328: 
shr ecx 1 ;value= value > 1; 
;内 循环 体 结束 
jne SHORT LL5cf38 ;如 果 value 不 为 0 继续 内 循环 
if count > 20) break; 
ap ek 
jg SHRT LNicf38 
LNBcf328: ;外 循环 体 结束 
inc eax ;i++ 
ap eax, DWORD PIR [ebp+ 12] :i<n? 
jl SHORT Lgcf38 ;如 果 i<n, 继 续 外 循环 
ap ek 20 浏 断 是 否 找到 特征 数据 
jg SHORT LNicf328 
LNI7cf328: 
or eax -1 Hk 
LNicf328: 
pp gp ;撤销 堆栈 框架 
ret 


由 于 只 要 求 目 标 代码 的 尺寸 最 小 化 ,因此 从 上 述 目标 代码 中 ,可 以 清楚 地 看 到 外 循环 for 
和 内 循环 while 的 实现 。 

从 上 述 目标 代码 中 ,还 可 以 清楚 地 看 到 break 语句 和 continue 请 句 的 具体 实现 。 它 们 的 
本 质 就 是 转移 。 在 这 里 它们 从 属于 条 件 语句 ,所 以 体现 为 条 件 转移 。 

另外 ,请 比较 例 3-47 统计 二 进 制 数 1 的 实现 方法 。 

【 例 3-54】 设 buffer 缓冲 区 中 有 10 个 整数 ,编写 一 个 代码 片段 ,将 它们 由 小 到 大 排序 。 

有 各 种 各 样 的 排序 算法 ,这 里 为 了 方便 地 说 明 二 重 循环 ,采用 选择 排序 ,图 3. 14 给 出 了 排 
序 算法 流程 图 ,其 中 N 表示 待 排序 的 数据 个 数 ; I 和 J 分 别 表 示 从 0 开始 的 下 标 。 

设 buffer 缓冲 区 定义 如 下 : 

int buffer[10|={ 222 1, 300 -30 67, 10 7 8 2 -17}; 

实现 选择 排序 的 代码 片段 as329 如 下 。 其 中 ,ESI 相当 于 外 层 循环 控制 变量 I, EDI 相当 
于 内 层 循环 控制 变量 J, 寄 存 器 EBX 含有 数据 缓冲 区 开始 地 址 。 

# define LN 10 

汇编 代码 片段 as32 


_asm{ 


LEA ERX buffer ;设置 缓冲 区 开始 地 址 





MN EM [EBKr ES] 
QP ”EAX [EB 杀 印 ] 
JE NEW 

XH EM [EBX+ 杀 印 中 
MOV [EBX ES], EX 


上 HH1 


:A[ 吕 与 A 中 比较 

:A[D 小 于 等 于 AL 可 跳 转 
:A[ 口 与 AL 吕 交 换 

:上 上 出 1 

:JJ<N 时 跳 转 


;IE +1 


;1<N1 时 跳 转 


可 以 把 上 述 代 码 片 段 as329 嵌入 到 某 个 C 程序 中 ,实现 排序 的 功能 。 





准备 工作 


























A 上 一 =AD]7 
YN 
把 A 四 与 A 思 交换 












































图 3. 14 排序 算法 流程 图 
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3.5 子 程序 设计 


如 果 某 个 程序 片段 将 反复 在 程序 中 出 现 , 就 把 它 设计 成 子 程序 。 这 样 能 有 效 地 缩短 程序 
长 度 .节约 存储 空间 。 如 果 某 个 程序 片段 具有 通用 性 ,可 供 许 多 程序 共享 ,也 把 它 设 计 成 子 程 
序 。 这 样 能 大 大 减轻 程序 设计 的 工作 量 , 如 库 函 数 程序 。 此 外 , 当 某 个 程序 片段 的 功能 相对 独 
立时 ,也 可 把 它 设计 成 子 程序 ,这 样 便于 模块 化 ,也 便于 程序 的 阅读 、 调 试 和 修改 。 

在 汇编 语言 中 , 子 程序 常常 以 过 程 (Procedure) 的 形式 出 现 。 在 3. 1 节 介绍 过 程 调 用 和 返 
回 指令 的 基础 上 ,本 节 首 先 举例 说 明 设 计 子 程序 的 方法 和 规范 ,然后 进一步 介绍 调用 过 程 的 
方法 。 


3.5.1 子 程序 设计 要 点 


子 程序 是 供 主 程序 调用 的 ,所 以 在 设计 子 程序 时 ,必须 遵循 与 主 程序 的 约定 。 除 了 高 效 地 
完成 子 程序 相应 的 功能 外 ,在 设计 子 程序 时 ,需要 注意 ,传递 参数 的 方法 ; 安排 局 部 变量 的 方 
法 ; 保护 寄存 器 的 约定 ; 描述 子 程序 的 说 明 。 

1. 传递 参数 的 方法 

在 前 面 的 章节 中 已 经 介绍 了 一 些 子 程序 示例 ,从 中 可 以 看 到 传递 参数 的 方法 。 从 C 函数 
的 目标 代码 中 可 知 ,如 果 源 程序 中 默认 调用 约定 ,那么 利用 堆栈 传递 入 口 参数 (函数 参数 ) , 利 
用 寄存 器 传递 出 口 参 数 (函数 返回 值 )。 为 了 提高 效率 ,可 以 在 C 源 程序 中 明确 _fastcall 的 调 
用 约定 ,这 表示 和 希望 利用 寄存 器 传递 人 口 参数 ,在 采用 编译 优化 的 情形 下 ,所 得 目标 代码 利用 
寄存 器 传递 入 口 参数 。 

在 采用 汇编 语言 编写 子 程序 时 ,采用 哪 种 方法 传递 出 入 口 参 数 , 取 决 于 约定 。 在 例 3-3 的 
演示 程序 dp32 中 , 子 程 序 TUPPER 和 UPPER 就 是 利用 寄存 器 传递 出 入 口 参 数 。 在 例 3-50 
的 演示 程序 dp324 中 , 子 程序 AVER 就 是 利用 堆栈 传递 人 口 参数 ,利用 寄存 器 EAX 传递 出 口 
参数 。 

利用 寄存 器 传递 参数 ,虽然 简单 并 且 效 率 比 较 高 ,但 由 于 寄存 器 较 少 ,可 传递 参数 比较 少 。 
利用 堆栈 传递 参数 比较 复杂 并 且 效率 较 低 ,但 可 以 传递 足够 多 的 参数 。 

【 例 3-55】 分 析 如 下 所 列 C 函数 cf330 的 目标 代码 。 该 函数 的 功能 是 把 一 个 无 符号 整数 
(32 位 二 进 制 数 ) 转 换 为 8 位 十 六 进 制 数 的 ASCII 码 串 。 函 数 有 两 个 人 口 参 数 ,分 别 是 整数 m 
和 存放 ASCII 码 串 的 首 地 址 ,希望 采用 寄存 器 传递 和 人口 参数 。 

void _fastcall cf33 unsigned m char * buffer) 

{ 


int i; 
char val; 
for i=1; i<=8; i+H /循环 8 次 
{ 
val=(m> (3 9)) & OOF; // 先 向 右 移 ,再 截取 4 位 
val+='0'; // 转 成 对 应 ASCI 码 
if val > '9) val+=7; 
* buffer++= val; /依次 保存 


] 
* buffer="\0'; /ASoll 码 串 结束 标记 





由 于 4 个 二 进 制 位 对 应 一 个 十 六 进 制 位 ,因此 直接 采用 移 位 的 方式 来 得 到 各 个 十 六 进 制 
位 。 无 符号 整数 是 32 位 二 进 制 数 ,对 应 8 个 十 六 进 制 位 ,因此 循环 8 次 。 
采用 编译 优化 选项 “使 大 小 最 小 化 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 的 目标 代码 ,分 号 


之 后 是 添加 的 注释 。 

;cf39 的 目标 代码 ( 大 小 最 小 化 ) 
push esi 

xor esi, esi 

push edi 

mov edi, ecx 

inc esi 

UL4cf330: 


:3 
& 


a 
a 
和 

: 


3 
8 


ap esi,8 

jle SHORT UL4cf3390 
pp edi 

mv BYTEPTR [edkx], 0 
pop esi 

ret 


;保护 寄存 器 esi 

iesi 作为 局 部 变量 i /@o 
;保护 寄存 器 edi 

;edi=m 

;=1 


;val=(m>>( 3 i*4)) & OxOf; 
;ecce8/ao 


;ecoc(8- i)*4 
;eaxEm 

;eacm>>( RD i 4 
& OOF 

;val+='0'; 

;到 val > '9) val+=7; 


六 buffer++= val; 


aaa 

站 <=8 吗 ? 
是 , 则 跳 转 
恢复 edi 

冰 buffer= 八 0' ; 
恢复 esi 


由 于 源 程序 中 采用 了 调用 约定 _fastcall, 而 且 又 选择 了 编译 优化 ,因此 通过 寄存 器 向 函数 
传递 人 口 参数 。 从 上 述 目标 代码 可 知 ,利用 寄存 器 ecx 传递 参数 mm, 利 用 寄存 器 edx 传递 参数 


buffer。 


由 于 选择 了 编译 优化 ,从 上 述 目标 代 码 还 可 知 ,给 动态 局 部 变量 i 分配 了 寄存 器 esi, 给 动 
态 局 部 变量 val 分 配 了 寄存 器 eax( 或 者 al) 。 这 样 能 够 有 效 地 提高 执行 效率 。 同 时 ,还 可 以 看 
到 ,由 于 使 用 了 寄存 器 esi 和 edi, 因 此 在 一 开始 就 把 它们 压 入 堆栈 保护 ,在 子 程序 返回 之 前 从 


堆栈 中 将 其 恢复 。 


在 上 述 目 标 代码 中 ,还 有 一 些 优 化 措施 , 见 注释 中 带 //@o 的 行 ,将 在 第 5 章 中 介绍 。 
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2. 安排 局 部 变量 的 方法 

为 了 实现 自身 的 功能 , 子 程序 (函数 ) 往 往 还 需要 定义 一 些 局 部 变量 ,以便 清 楚 地 表达 处 理 
逻辑 ,临时 保存 中 间 结 果 。 局 部 就 是 限于 子 程序 (函数 ) 或 者 限于 代码 片段 (复合 语句 ) 。 

例 3-55 中 整 型 变量 i 和 字符 变量 val ,都 是 动态 局 部 变量 。 由 于 选择 了 编译 优化 ,把 这 两 
个 变量 安排 在 寄存 器 中 。 虽 然 寄 存 器 作为 局 部 变量 可 以 提高 效率 ,但 寄存 器 数量 较 少 ,所 以 一 
般 不 把 局 部 变量 安排 在 寄存 器 中 。 在 3. 1 节 中 介绍 了 利用 堆栈 来 安排 局 部 变量 ,这 个 方法 虽 
然 较 复杂 ,但 可 以 安排 足够 多 的 局 部 变量 。 实 际 上 ,在 C 函数 的 目标 代码 绝 大 部 分 的 局 部 变 
量 被 安排 在 堆栈 中 。 在 不 要 求 编译 优化 时 ,通常 局 部 变量 都 被 安排 在 堆栈 中 。 在 前 面 多 个 没 
有 经 过 编译 优化 的 目标 代码 中 ,可 以 清楚 地 看 到 这 一 点 。 

下 面 是 一 个 把 局 部 变量 安排 在 寄存 器 中 的 示例 。 

【 例 3-56】 分 析 如 下 C 函数 cf331 的 目标 代码 。 该 函数 的 功能 是 统计 整 型 数组 中 值 为 正 
数 、 负 数 和 0 的 元 素 个 数 。 函 数 有 4 个 人 口 参数 ,其 中 ,两 个 参数 指定 数组 和 数组 长 度 , 另 两 个 
参数 是 指针 ,指出 存放 正 数 和 负数 个 数 的 所 在 。 函 数 返 回 值 是 指定 数组 中 值 为 0 的 元 素 个 数 。 

int cf33K int arr[ ], int mn int*pp, int* pn) 

{ 

int i, poont, ncount, zoont; 
pcount= ncount= zcount= 0; 
for i=0; i<n; i+h /循环 ,依次 检查 并 统计 
{ 
if arr[ i > 0) 
poountt+ ; 
else if arr[ 1 < 0) 
noountt+ ; 
else 
zoountt+ ; 
} 
* pp= poount; 1/ 送出 正 数 的 个 数 
* prF noount; /送出 负数 的 个 数 
return zoont; /返回 0 的 个 数 

} 

采用 编译 优化 选项 “使 速度 最 达 化 ”, 编 译 上 述 程序 后 ,可 得 到 如 下 所 示 的 目标 代码 ,分 号 
之 后 是 添加 的 注释 。 


;cf331 的 目标 代码 ( 使 速度 最 大 化 ) 

;利用 堆栈 传递 人 口 参数 ,利用 寄存 器 eax 传递 出 口 参数 
push ep 

mov ep, ep ;建立 堆栈 框架 
push ebx ;保护 ebx 

mov ebx, DWORD PIR [ebpr 何 ;ebecn 

push esi ;保护 esi、edi 
push edi 

xor eax, eax ;zoont=0 

xor esi, esi ;incount= 0 

xor edi, edi ;pcount= 0 

xor edx, edx ;=0 





edx，DWORD PTR [ebp+r 16] 


新 概念 汇编 语言 
test ebx, ebx 
jle SHORT LN5cf331 
LL7cf331: 
mov ecx, DNORD PIR [ebpr 引 ;ece arr 
mv ecx, DWORD PIR [ecxr edxk 本 ;ecc arr[ 中 
test ecx, ecx 测 arr[ 癌 的 正 负 
jle ”SHORT LNI2cf331 iarr[ <=0, 则 跳 转 
inc edi ;poountt+ ; 
mp SHORT LNecf331 
LN12cf331: 
jns SHORT LNZcf331 
inc esi ;ncount++ ; 
jmp SHORT LNécf331 
LN2cf331: 
inc eax ;zcount+ 十 
UNWcf331: 
inc edx ;i++ 
ap ed, ebx ii<n 吗 ? 
jl SHORT LL7cf39 ii< m 继续 循环 
LN5cf331: 
mov 
mov 
mv DWORD PTR [edx], edi 证 pp= pcount; 
pp edi 
mv DWORD PTR [ecx], esi 六 prF ncount; 
pop esi 
pp ex :恢复 被 保护 的 寄存 器 
pp ep ;撤销 堆栈 框架 
ret 


从 上 述 目标 代码 可 知 ,由 于 要 求 了 编译 优化 ,因此 pcount 等 4 个 局 部 变量 都 被 安排 在 寄 
存 器 中 。 在 开始 部 分 , 先 利用 堆栈 保护 了 寄存 器 ebx、esi 和 edi, 在 返回 之 前 ,从 堆栈 中 弹出 以 
恢复 它们 原先 的 值 。 

3. 保护 寄存 器 的 约定 

子 程序 为 了 完成 其 功能 ,通常 要 临时 利用 一 些 寄存 器 存放 内 容 。 例 如 ,作为 局 部 变量 使 
用 。 也 就 是 说 ,在 子 程序 运行 时 有 了 时 会 破坏 一 些 寄存 器 的 原 有 内 容 。 所 以 ,如 果 不 采取 措施 ， 
那么 在 调用 子 程序 后 , 主 程序 就 无 法 再 使 用 这 些 寄 存 器 的 原 有 内 容 了 ,这 常常 会 导致 主 程序 的 
错误 。 为 此 ,要 对 有 关 寄 存 器 的 内 容 进行 保护 与 恢复 。 

保护 寄存 器 内 容 的 简单 方法 是 ,在 子 程序 一 开始 就 把 在 子 程序 中 会 改变 的 寄存 器 内 容 压 
入 堆栈 ,而 在 返回 之 前 再 恢复 这 些 寄存 器 的 内 容 。 

由 于 子 程序 往往 会 用 到 多 个 寄存 器 ,把 这 些 用 到 的 寄存 器 全 部 压 人 堆栈 加 以 保护 ,过 后 再 
恢复 ,这样 做 会 降低 代码 效率 。 实 际 上 ,这 是 主 程序 和 子 程序 之 间 缺 少 * 默 契 >”。 从 前 面 多 个 C 
函数 的 目标 代码 可 知 ,一 方面 :函数 代码 虽然 使 用 寄存 器 eax、ecx 和 edx, 但 并 不 事先 保护 它 
们 ; 另 一 方面 ,函数 代码 只 要 使 用 了 寄存 器 ebx、esi、edi 和 ebp ,总 是 先 保护 它们 ,过 后 再 恢复 。 
这 体现 了 C 语言 中 主 程序 与 子 程序 的 “默契 ”>。 还 可 以 看 到 ,函数 为 了 通过 ebp 访问 堆栈 中 的 
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可 能 存在 的 参数 和 局 部 变量 ,所 以 在 建立 堆栈 框架 时 , 先 把 ebp 压 人 堆栈 ,然后 把 esp 送 到 
ebp ,最 后 通过 弹出 ebp, 恢 复 ebp 原先 内 容 ,来 撤销 堆栈 框架 。 当 然 ,函数 代码 对 堆栈 指针 寄 
存 器 esp 的 使 用 是 极其 谨慎 的 。 

因此 ,保护 寄存 器 的 常用 方法 是 子 程序 只 保护 主 程序 关心 的 那些 寄存 器 。 所 谓 关心 的 寄 
存 器 ,是 根据 主 程序 与 子 程序 的 约定 来 确定 的 。 这 样 处 理 , 既 达 到 了 保护 寄存 器 的 目的 ,又 减 
少 效率 损耗 。 例 3-55 和 例 3-56 都 采用 这 种 常用 的 保护 方法 。 当 然 ,如 果 约 定 所 有 寄存 器 都 
是 “关心 ”的 ,那么 就 退化 为 只 要 破坏 ,就 加 以 保护 。 

值得 指出 ,在 利用 堆栈 进行 寄存 器 的 保护 和 恢复 时 ,一 定 要 注意 堆栈 的 先进 后 出 特性 ,一 
定 要 注意 堆栈 平衡 。 

至 此 可 以 看 到 ,在 堆栈 中 既 要 存放 传递 给 子 程序 的 入 口 参 数 , 又 要 存放 子 程序 的 返回 地 
址 ,还 有 可 能 利用 堆栈 来 保护 寄存 器 的 内 容 , 所 以 堆栈 中 的 内 容 较 为 混杂 。 但 是 ,绝对 不 能 出 
现 差错 ,绝对 不 能 失去 平衡 ,除非 为 了 特殊 目的 而 故意 为 之 。 在 子 程序 开始 之 初 ,建立 堆栈 框 
架 ,在 子 程序 返回 之 前 ,撤销 堆栈 框架 ,这 是 一 个 比较 好 的 方法 。 

4. 描述 子 程序 的 说 明 

为 了 能 正确 地 使 用 子 程序 ,在 给 出 子 程序 代码 时 还 要 给 出 子 程序 的 说 明 信 息 。 子 程序 说 
明 信 息 一 般 由 以 下 几 部 分 组 成 ,每 一 部 分 的 表述 应 该 简明 确切 。 

(1) 子 程序 名 (或 者 人 口 标号 ) 。 

(2) 子 程序 功能 描述 。 

(3) 子 程序 的 入 口 参 数 和 出 口 参 数 。 

(4) 所 影响 的 寄存 器 等 情况 。 

(5) 使 用 的 算法 和 重要 的 性 能 指标 。 

(6) 其 他 调用 注意 事项 和 说 明 信 息 。 

(7) 调用 实例 。 

子 程序 的 说 明 信 息 至 少 应 该 包含 上 述 前 三 部 分 的 内 容 。 


3.5.2 子 程序 设计 举例 


下 面 采用 嵌入 汇编 代码 方式 ,举例 说 明子 程序 的 设计 。 

【 例 3-57】 编写 把 二 进 制 数 (32 位 ) 转 换 为 十 六 进 制 数 (8 位 )ASCII 码 串 的 子 程序 。 这 个 
子 程序 的 功能 ,与 例 3-55 函数 cf330 的 功能 相同 。 

实现 上 述 功 能 的 子 程序 as332 如 下 ,以 注释 方式 给 出 了 子 程序 的 相关 说 明 信 息 。 


/于 程序 名 ( 入 口 标号 : BIOHS 
/动能 :把 有 位 二 进 制 数 转 换 为 8 位 十 六 进 制 数 的 ASCN 码 串 
/入 口 参 数 :( 1) 存放 ASCN 码 串 缓冲 区 的 首 地 址 ( 先 压 入 堆栈 ) 
AN (2) 二 进 制 数 据 ( 后 压 和 人 堆栈) 
/出 口 参数 : 无 
/其 他 说 明 :(1) 缓冲 区 应 该 足够 大 ( 至 少 9 个 字 节 ) 
/ (2) ASCN 串 以 字 节 0 为 结束 标记 
A/ (3) 影响 寄存 器 EXM.EX、EX 的 值 
__asmf 
BTOHS: 浮 程 序 人 口 标号 
RsH EP 
MV ”EBP EP ;建立 堆栈 框架 





PUSH I ;保护 寄存 器 印 | 
MOV 印 !,， [EBP+ 何 ;取得 存放 ASCN 码 串 的 首 地 址 
MW EX [EEP+ a ;取得 待 转换 数据 
MV EX 8 ;设置 循环 次 数 
NEXT: 
RL EX 4 ;循环 左 移 4 位 ,高 4 位 移 到 低 4 位 
MV AD 待 转换 数据 送 到 儿 
AD AL OH ;把 外 中 低 4 位 转换 成 对 应 的 ASCN 码 
AD AL '0 
OP AL '9' 
JE ”LAB590 
AD AL7 
LAB580: 
WW [m0D,AL ;把 所 得 字符 保存 到 缓冲 区 
IND BI ;调整 缓冲 区 指针 
LOOP NET ;循环 ,转换 下 一 个 4 位 
MV EYE PTR [EBD , 0 ; 置 字符 串 结束 标志 
POP EI 恢复 印 | 
POP ”EBP 
FET 


} 
与 例 3-55 函数 cf330 的 目标 代码 相 比 ,上 述 子 程序 不 仅 利用 指令 LOOP 进行 循环 控制 ， 
而 且 利用 移 位 指令 ROL 进行 循环 移 位 ,从 而 使 得 代码 更 简洁 。 由 于 使 用 了 主 程序 可 能 “ 关 
心 ” 的 寄存 器 EDI, 因 此 一 开始 就 压 入 堆栈 保护 。 此 外 ,还 利用 堆栈 传递 人 口 参 数 。 
【 例 3-58】 编写 一 个 子 程序 ,把 由 十 进 制 数字 符 构成 的 字符 串 转换 成 对 应 的 数值 。 
本 例子 程序 实现 例 3-51 代码 片段 相反 的 功能 。 
设 十 进 制 数字 串 中 各 位 对 应 的 值 为 d,、d,-1、…、ds、di: 那 么 它 所 表示 的 二 进 制 数 可 由 下 
式 计算 得 出 : 
Y=((((0X10+d,) X10+d,-1)X10+*…)X10+d;) X10+di 
可 通过 迭代 的 方法 进行 上 式 的 计算 ,迭代 公式 如 下 ,Y 的 初 值 为 0: 
Y=YX10+di(i=n,n—1,.…,1) 
所 以 , 当 十 进 制 数字 串 中 数字 符 的 个 数 为 nn 时 ,那么 只 需 进 行 n 次 迭代 计算 。 
实现 功能 要 求 的 子 程序 as333 如 下 ,以 注释 的 方式 给 出 了 子 程序 的 相关 说 明 信 息 。 
/于 程序 名 ( 入 口 标 易 : DSTOBV 
/ 动 ”能 : 把 十 进 制 数字 串 转换 成 对 应 的 二 进 制 数值 
// 入 口 参数 : BS= 待 转换 数字 串 的 起 始 地 址 偏 移 
AN ECe 待 转换 数字 串 的 长 度 ( 十 进 制 数字 的 位 数 ) 
/出 口 参数 : ENE 转换 所 得 数值 
/ 锐 明 : (1) 不 考虑 数字 串 过 长 的 情形 





/ (2) 寄存 器 EX、EX、EX.ESI 受 到 影响 
_asm{ 
DSTOBV: 
XR EX EX ;EX 作为 Y 
XR EX EX 


JE02 LAB2 :排除 数字 串 为 空 的 情形 
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LAB1: 
IWL EX 10 :性 10 
MV AL [ESD ; 取 一 位 字符 
IN EI 
AD AL OH ;得 到 某 一 位 十 进 制 数 值 4 
AD EX EX 六 性 10Fd 
LOOP LB1 ; 渤 代 计算 
LAB2: 
MV EA EX ;准备 返回 值 
FET 


上 述 子 程序 虽然 考虑 了 数字 串 是 空 (ECX 为 0) 的 情形 ,但 没有 考虑 数字 串 过 长 的 情形 。 
在 实际 应 用 中 ,不仅 数字 串 的 长 度 往往 不 能 确定 ,而且 可 能 还 会 夹杂 非 数 字符 号 。 

【 例 3-59】 改写 例 3-58 的 子 程序 ,使 其 更 实用 。 

改写 后 的 子 程序 as334 如 下 所 示 ,并 以 注释 的 方式 给 出 了 子 程序 的 相关 信息 。 

/ 拖 程 序 名 ( 人口 标 易 : DST0B 

/ 动 ”能 : 把 十 进 制 数字 串 转 换 成 对 应 的 二 进 制 数值 , 遇 到 非 数 字符 结束 

/入 口 参 数 : BI= 待 转换 数字 串 的 起 始 地 址 偏 移 

/山口 参数 : ENE 转换 所 得 数值 ( 空 串 时 ,返回 值 是 0) 

1/ 说。 明 : (1) 数字 串 以 空 (9 为 结束 标志 ,或 者 非 数 字符 为 结束 标志 


/ (2) 如 果 数 字 串 太 长 ,导致 数值 超过 也 位 ,高 位 被 截 掉 
Wh (3) 寄存 器 杷 受 影响 
) (4 调用 子 程序 ISDIGIK 判断 是 否 是 数字 符 ) 
_asm{ 
DSTOB: 
PUsH ESI ;保护 寄存 器 ESI 
XR EX EX ;EX 作为 Y 
XR EX EX 
LAB1: 
MY AL [ESD ; 取 一 个 字符 
INC ESI 
CAL ISDIGIT 浏 断 字符 是 否 有 效 
R ALA 
了 UB :无效 , 跳 转 返回 
IWL EX 10 ;性 1 
AD AL OH ;得 到 某 一 位 十 进 制 数值 q 
AD EX EX 六 性 10Fd 
JWP LBl ;迭代 计算 
LAB2: 
MV EAX EX ;准备 返回 值 
POP EI 恢复 EI 
RET 


} 
上 述 子 程序 as334( 入 口 标号 DSTOB) 调 用 了 另 一 个 子 程序 as335( 入 口 标号 ISDIGIT) 来 
判断 某 个 字符 是 否 是 数字 符 , 子 程序 as335 的 代码 如 下 所 示 : 


新 概念 汇编 语言 





/和 子 程序 名 ( 入 口 标 易 : ISDIGIT 

/功能 : 判断 字符 是 否 为 十 进 制 数字 符 

/入口 参 数 : 和 字符 

/出 口 参数 : 如 果 是 非 数 字符 ,A=0; 否则 儿 保 持 不 变 


_asm{ 
ISDIGIT: 
QP 人 L'0 演 字 符 '0 比 较 
LIsplGl 有 有效 字 符 是 '0'- "9 
QP AL'9 
WA lsplGl 
FRET 
ISDIG1: 非 数 字符 
XR LAL :A=0 
FET 


下 面 通过 另 一 个 示例 演示 调用 上 述 子 程序 。 
【 例 3-60】 演示 调用 上 述 子 程序 as334( 入 口 标 号 DSTOB) 和 子 程序 as335( 入 口 标号 
ISDIGIT)。 
演示 调用 上 述 子 程序 的 主 程序 dp336 的 框架 如 下 所 示 : 
#include < stdioh> 
int mair() 
{ 
char buff1l[16]=" 328" ; 
char buff2[16]= " 1234024" ; 


unsigned x1, x2 
unsigned sum 
| 
LEA ESI, buff1 ;转换 一 个 字符 串 
CAL DSTB 
MOV x1，EAX 
LEA ESI, buff2 ;转换 另 一 个 字符 串 
CAL DSTB 
WwW 2X 
Wov EDX xf ;: 求 和 
AD EX X2 
MV sum EDX 
;如 这 些 代码 位 于 前 面 
JWP &k ;通过 该 指令 来 跳 过 随后 的 子 程序 部 分 Ma1 
} 
六 
/在 这 里 安排 子 程序 DSTB 和 ISDIGIT 的 代码 
AN/ 


kK: 
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printg" %d\n” , sum) ; 
retum 0; /2 
} 
需要 特别 指出 ,上 述 的 程序 组 织 方 式 在 //@1 行 的 无 条 件 转移 指令 “JMP OK" 很 重要 ， 
利用 该 指令 跳 过 随后 的 子 程序 的 代码 。 如 果 把 子 程序 as334 和 as335 的 代码 安排 在 最 后 
(//@2 之 后 ) ,在 利用 较 低 版 本 的 编译 器 编译 时 ,不 能 选择 “使 速度 最 大 化 ”编译 优化 选项 。 
【 例 3-61】 采用 汇编 语言 编写 一 个 子 程序 as337 ,实现 C 请 言 库 函 数 strstr() 的 功能 。 库 
函数 strstr() 的 原型 如 下 : 
char * strstr( char * str1, char * str2) ; 
其 功能 是 ,在 字符 串 strl 中 查找 字符 串 str2 中 第 一 次 出 现 的 位 置 。 如 果 在 字符 串 strl 中 
找到 字符 串 str2, 返 回 该 位 置 的 指针 ; 如 果 没 有 找到 ,返回 空 指针 。 
判断 一 个 字符 串 是 否 是 另 一 字符 串 的 子 串 的 方法 很 多 , 现 选取 实现 较 简单 的 一 种 算法 。 
子 程序 as337 如 下 所 示 : 
/和 子 程 序 名 ( 入口 标号 : STRSTR 
// 功 能 : 在 字符 串 str1 中 查找 第 一 次 出 现 的 字符 串 str2 
/说 明 : 符合 6 函数 的 调用 约定 





_asm{ 
STRSTR: 
RsH EP 
WwW Ep, EP ;建立 堆栈 框架 
PUSH EX ;保护 相关 寄存 器 
PusH ESI 
psH I 
测字 符 串 2 的 长 度 
WW EI, [EBP+ 休 
pC Bl 
NEXT: 
IN I 
QP BYE PTR [ED,0 ;从 串 2 取 一 个 字符 
JZ_ NXT ;如 果 串 2 没有 结束 ,继续 
Ww EX mI ;EX 指向 串 2 结束 标记 处 
MV EMX [EBP+ 们 
SB EX EX ;地 址 差 是 串 2 长 度 
JEOCZ WRI ;如 果 串 2 为 空 ,不 需要 搜索 
:在 串 1 中 ,搜索 串 2 
MW EX EX ;保存 串 2 长 度 
WwW EX [EBP+ 引 ; 取 串 1 首 地 址 
FORI: 
Ww El, EX ;BE 开始 搜索 串 1 的 起 始 地 址 
WW BI, [EBP+ 局 ;DF= 串 2 首 地 址 
MOV EX EX ;EGE 串 2 长 度 





MV 人 AL [ESD 

QP AL [BID ;比较 一 个 字符 

JZ NENI ;不 等 ,从 串 1 下 一 个 字符 重新 搜索 
NEXTJ: 

IN BI 

IN EI 

LOP FRJ ;继续 比较 下 一 字符 

JWP WR ;在 串 1 中 ,搜索 到 串 2 
NEXTI: 

INC EX ;从 串 1 的 下 一 个 字符 开始 

RR LA 浏 断 串 1 是 否 结束 

JZ FRI ;没有 结束 ,重新 开始 搜索 

;至 此 , 串 1 已 经 结束 

OVER1: 

XOR EX EM 
OVER2: 

WW EAX EX ;准备 出 口 参数 

POP EI ;恢复 寄存 器 

POP ESI 

POP EX 

POP EP ;撤销 堆栈 框架 

FET 


} 

在 上 述 程序 片段 中 ,首先 是 采用 一 个 循环 测量 字符 串 2 的 长 度 。 测 量 方法 是 结束 地 址 减 
去 起 始 地 址 ,这 与 例 3-45 的 方法 相同 。 然 后 ,采用 一 个 二 重 循环 ,判断 字符 串 2 是 否 为 字符 串 
1 的 子 串 ,外 层 循环 控制 依次 遍历 字符 串 1 中 的 字符 ,内 层 循 环 控制 在 字符 串 1 的 某 个 位 置 开 
始 , 依 次 与 字符 串 2 中 的 字符 比较 。 


3.5.3 子 程序 调用 方法 


在 3.1 节 简单 介绍 了 过 程 调 用 和 返回 指令 ,为 了 更 好 地 应 用 这 些 指令 调用 子 程序 ,本 节 作 
进一步 的 介绍 。 

1. 过 程 调用 指令 

与 无 条 件 转 移 指 令 JMP 相 比 ,过 程 调 用 指令 CALL 会 把 返回 地 址 压 入 堆栈 ,其 他 方面 都 
是 相似 的 。 过 程 调 用 指令 实施 转移 ,在 转移 的 范围 和 转移 的 方式 上 ,与 无 条 件 转移 指令 是 一 样 
的 。 在 机 器 码 的 格式 上 ,过 程 调用 指令 与 无 条 件 转移 指令 也 是 一 样 的 。 

在 3. 3. 2 节 介 绍 过 段 内 转移 和 段 间 转移 的 概念 ,也 介绍 过 直接 转移 和 间接 转移 的 概念 。 
像 无 条 件 转移 指令 一 样 , 过 程 调用 指令 有 段 内 调用 和 段 间 调 用 之 分 ,有 时 也 称 为 近 调 用 和 远 调 
用 。 按 照 给 出 过 程 和 人口 地 址 的 方式 来 分 ,过 程 调用 指令 分 为 直接 调用 和 间接 调用 。 这 样 ,过 程 
调用 指令 可 分 为 4 种 : 段 内 直接 调用 、 段 内 间接 调用 、 段 间 直 接 调用 和 段 间 间接 调用 。 

虽然 有 4 种 过 程 调用 指令 ,但 在 汇编 语言 中 , 均 用 指令 助 记 符 CALL 表示 。 

过 程 调用 指令 不 影响 状态 标志 。 

(1) 段 内 直接 调用 指令 。 在 3. 1 节 介 绍 的 过 程 调用 指令 ,就 是 段 内 直接 调用 指令 。 在 前 
面 的 示例 中 ,已 经 多 次 用 到 。 这 里 可 以 简单 地 认为 ,除了 保存 返回 地 址 外 , 段 内 直接 调用 指令 
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CALL 与 无 条 件 段 内 直接 转移 指令 JMP 是 一 样 的 。 
(2) 段 内 间接 调用 指令 。 段 内 间接 调用 指令 的 使 用 格式 如 下 : 
OWL OD 


该 指令 调用 由 操作 数 OPRD 给 出 入 口 地 址 偏 移 的 子 程序 。 执 行 如 下 具体 操作 : 
Q@ 把 返回 地 址 偏 移 压 和 人 堆栈 保存 。 
@ 把 OPRD 的 内 容 ( 目 标 地 址 偏 移 ) 送 到 EIP, 从 而 实现 转移 。 在 保护 方式 下 (32 位 代码 
段 ) ,OPRD 是 32 位 通用 寄存 器 或 者 双 字 存储 单元 。 
同样 可 以 简单 地 认为 ,除了 保存 返回 地 址 外 , 段 内 间接 调用 指令 CALL 与 无 条 件 段 内 间 
接 转移 指令 JMP 是 一 样 的 。 
【 例 3-62〗 如 下 指令 演示 了 段 内 间接 调用 指令 的 使 用 。 
OL EX 主 程 序 人 口 地 址 是 寄存 器 EX 的 内 容 
COAL DoD PTR [EDX] ;人 口 地 址 是 由 EX 给 定 的 双 字 存储 单元 内 容 
(3) 段 间 调用 指令 。 段 间 直接 调用 指令 的 使 用 格式 与 上 述 的 段 内 直接 调用 指令 相似 , 段 
间 间 接 调用 指令 的 使 用 格式 和 上 述 的 段 内 间接 调用 指令 相 类 似 。 同 样 地 ,这 些 指令 分 别 与 段 
间 直 接 转移 指令 和 段 间 间接 转移 指令 也 相似 。 在 执行 段 间 调用 指令 时 ,首先 要 把 返回 地 址 压 
入 堆栈 ,然后 再 转 到 子 程序 人 口 地 址 处 。 但 由 于 段 间 调 用 要 改变 代码 段 寄存 器 CS, 因 此 在 把 
返回 地 址 压 人 堆栈 时 , 先 要 把 CS 压 人 堆栈 ,再 把 EIP 压 人 堆栈 。 由 于 涉及 改变 代码 段 寄存 器 
CS 的 内 容 , 因 此 较为 复杂 ,将 在 第 6 章 和 第 9 章 作 进一步 介绍 。 
2. 间接 调用 子 程序 示例 
下 面 通过 示例 来 说 明 间 接 调用 子 程序 的 方法 。 
【 例 3-63】〗 如 下 C 语言 程序 dp338 演示 段 内 间接 调用 指令 的 使 用 。 
#include < stdioh> 


int subr_addr; /用 于 存放 子 程序 人 口 地 址 
int valu; /用 于 保存 结果 
int mair() 
{ 
_asn{ 
LEA EX SUBR2 /取得 子 程序 2 的 入 口 地址 
MV subr_addr, EDX // 保 存 到 存储 单元 
LEA EX SUBRI /取得 子 程序 1 的 入 口 地 址 
XR EX EX /人 口 参数 =0 
AL EX // 凋 用 子 程 序 《 段 内 间接 调用 ) 
OL sbr addr /调用 子 程序 X 段 内 间接 调用 ) 
Mov valu EAX 
} 
printfk" valu= % d\n" ,valu) ; /显示 为 vals 2B 
return 0; 
MA 
_asm{ /嵌入 汇编 代码 


SUBR1: // 示 例子 程序 1 





AD EX8 
RET /返回 

seo- /示例 子 程序 2 
AD ”EAX 2 
FET /返回 


上 述 演示 程序 dp338 的 嵌入 汇编 代码 部 分 ,先后 演示 了 通过 寄存 器 和 存储 单元 间接 调用 
子 程序 。 作 为 演示 ,所 以 两 个 子 程序 都 很 简单 ,通过 寄存 器 传递 出 入 口 参数 。 注 意 ,包含 两 个 
子 程序 的 嵌入 汇编 代码 ,被 安排 return 语句 之 后 。 

【 例 3-64】 如 下 C 程序 dp339 演示 了 指向 函数 指针 的 使 用 ,分 析 对 应 的 目标 代码 ,观察 
指向 函数 指针 的 具体 实现 细节 。 

#include < stdioh> 


int maX int x int y) ; /声明 函数 原型 

int mir int x int y) ; /声明 函数 原型 

Wh 

int mair() 

{ 
int (*pf) (int, int) ; /定义 指向 函数 的 指针 变量 
int val1, val2; /存放 结果 的 变量 
pf= max; // 使 得 pf 指向 函数 max 
valf=(*pf) ( 1315) ; /调用 由 pf 指向 的 函数 
pf= min; /使 得 pf 指向 函数 min 
val 估 ( 半 pf) ( 25) ; /调用 由 pf 指向 的 函数 
printk" %d% d\n" ,vall,val2) ; // 显 示 为 .2B 
retum 0; 


} 
为 了 更 清楚 地 观察 到 指向 函数 的 指针 变量 的 具体 实现 ,补充 函数 max 和 函数 min 的 源 代 
码 ,不 采用 编译 优化 ,编译 上 述 源 程序 后 ,可 得 如 下 的 目标 代码 (标号 稍 有 修饰 ) 。 


程序 39 的 目标 代码 ( 不 采用 编译 优化 ) 
;标号 max_YAHHH、 标 号 min_YAHHH, 分 别 表 示 函 数 的 入 口 地 址 


push ebp 
mv ep, ep :建立 堆栈 框架 
sb esp,12 ;安排 3 个 局 部 变量 pf、vall 和 val2 


pf mex; 
mv DNORD PTR [ebp- 4], OFFSET max_YAHHH 
;valF(*pf) (1315) ; 
push 15 
push 13 
call DWORD PTR [ebp-4] ;间接 调用 指针 所 指 的 函数 mex 
add esp, 8 
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;val 仁 返回 结果 
mv DWORD PTR | ebp- 12|, eax 
pf min; 
mv DNRDPIR [ebp- 4], OFFSET min YAHHH 
valF(*o (2B) ; 
psh 5 
push 2B 
call DWORD PTR [ebp- 本 ;间接 调用 指针 所 指 的 函数 min 
add esp, 8 
;al 三 返回 结果 
printR" %d % d\n" ,vall,val2) ; 
mov eax, DWORD PIR [ebp- 8] ;eaxc val2 
push eax 
mov ecx, DWORD PIR [ebp- 12] ;ecx= vall 
push ecx 
push OFFSET FORMTS 格式 字符 串 
call _ printf 北 内 直接 调用 /@c 
add esp, 12 平衡 堆栈 
xor eax, eax ;准备 返回 值 
mv esp, ep ;撤销 局 部 变量 
pp ep :撤销 堆栈 框架 
ret 


从 上 述 目标 代码 可 知 ,依靠 间接 调用 指令 ,实现 指向 函数 的 指针 变量 的 功效 。 函 数 的 3 个 
局 部 变量 被 安排 在 堆栈 中 ; 通过 堆栈 向 子 程序 传递 参数 ; 在 调用 结束 后 ,及 时 平衡 堆栈 。 

如 果 在 项 目的 常规 配置 属性 ”MFC 的 使 用 ”选项 中 ,采用 “使 用 标准 Windows 库 ”, 编 译 上 
述 源 程序 dp339 后 ,所 得 目标 代码 会 采用 间接 调用 方式 调用 库 函 数 ,而 不 是 现在 的 段 内 直接 调 
用 方式 , 见 注释 带 //@c 的 行 。 

3. 过 程 返回 指令 

过 程 返回 指令 用 于 从 子 程序 返回 到 主 程序 。 在 执行 该 指令 时 ,从 堆栈 顶 弹出 返回 地 址 ,并 
转移 到 所 弹出 的 地 址 ,这 样 就 实现 了 返回 。 通 常 , 这 个 返回 地 址 就 是 在 执行 对 应 的 调用 指令 时 
所 压 入 堆栈 的 返回 地 址 。 

过 程 返 回 指令 的 使 用 应 该 与 过 程 调用 指令 所 对 应 。 如 上 所 述 , 过 程 调 用 分 为 段 内 调用 和 
段 间 调用 ,所 以 过 程 返回 指令 也 分 为 段 内 返回 和 段 间 返 回 。 过 程 返回 指令 没有 直接 与 间接 之 
分 。 但 过 程 返回 指令 却 可 选 带 一 个 立即 数 ,以便 在 返回 的 同时 撤销 在 堆栈 中 的 参数 。 

过 程 返回 指令 不 影响 标志 寄存 器 中 的 状态 标志 。 

(1) 段 内 返回 指令 。 在 前 面 示例 中 所 用 的 返回 指令 ,都 是 段 内 返回 指令 。 

(2) 段 内 带 立 即 数 返回 指令 。 段 内 带 立 即 数 返回 指令 的 格式 如 下 ,其 中 count 是 一 个 16 
位 的 立即 数 : 

FET ort 

该 指令 在 实现 段 内 返回 的 同时 ,再 额外 根据 count 值 调整 堆栈 指针 。 具 体操 作 是 , 先 从 堆 

栈 弹 出 返回 地 址 偏 移 (当然 会 调整 ESP) ,再 把 count 加 到 堆栈 指针 ESP 上 。 
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(3) 段 间 返回 指令 。 段 间 返 回 指令 与 段 间 调 用 指令 相对 应 , 它 从 堆栈 顶 弹出 的 返回 地 址 
不 仅 包含 返回 地 址 偏 移 ,还 包括 返回 地 址 的 段 号 ( 段 值 或 者 段 选 择 子 ) 。 在 第 6 章 将 进一步 介 
绍 段 间 返 回 指令 。 

4. 带 立 即 数 返回 指令 应 用 示例 

下 面 通 过 示例 来 说 明 带 立即 数 返回 指令 的 应 用 。 

【 例 3-65〗 对 比分 析 如 下 所 示 的 C 语言 源 程序 dp340 及 其 目标 代码 。 

#include < stdio.h> 


int 
{ 


] 


_stdcall cf34K int x int y) 


return (2+ xt St yt 100) ; 


mair() 

int val; 

val= cf34K 23 456) ; 
printk" val=%d\n” , val) ; 
return 0; 


除了 自 定义 的 函数 名 为 cf341 和 调用 约定 _stdcall 之 外 ,上 述 C 语言 源 程序 与 例 3-1 的 源 
程序 dp31 和 例 3-4 的 源 程 序 dp33 几乎 相同 。 由 于 采用 了 调用 约定 _stdcall, 因 此 由 函数 ( 子 
程序 ) 在 返回 的 同时 ,撤销 调用 时 压 人 堆栈 的 参数 。 

在 项 目 属性 中 ,采用 配置 属性 选项 “在 静态 库 中 使 用 MFC”, 同 时 采用 编译 优化 选项 “使 速 
度 最 大 化 ”, 编 译 上 述 程 序 后 ,可 得 到 如 下 所 示 的 目标 代码 (标号 和 名 称 稍 有 修饰 ) 。 


;函数 min 的 目标 代码 

push 456 ival= cf34K 23, 456) ; 

push 2 

call cf341YGHH ;直接 调用 函数 cf34 
;printR" val=%d\n" , val) ; 

push eax 

push OFFSET FORMS 

call DORD PR _irp_printf ; 闻 接 调用 函数 _printf 

add esp, 8 

xor eax, eax ;准备 返回 值 

ret 


从 上 述 main 函数 的 目标 代码 可 知 ,在 调用 函数 cf341 之 前 ,把 参数 太 人 堆栈 ,但 从 函数 
cf341 返回 之 后 ,并 没有 平衡 堆栈 ,撤销 堆栈 中 的 参数 。 由 于 配置 属性 中 “在 静态 库 中 使 用 
MFC”, 因 此 采用 间接 调用 指令 调用 库 函 数 printf ,而 且 随后 就 平衡 堆栈 。 此 外 ,由 于 编译 优化 
选项 “使 速度 最 大 化 ”, 因 此 用 寄存 器 eax 充当 局 部 变量 val 。 


;函数 cf341 的 目标 代码 

;通过 堆栈 传递 人 口 参 数 x 和 y 

;返回 时 撤销 由 主 程序 压 和 人 堆栈 的 参数 x 和 y 
push ebp 
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本 本 


| 


ebp，esp ;建立 堆栈 框架 
eax, DNORD PTR [ebp+ 12] ;取得 参数 y 
ecx DWORD PTR [ebpr 引 ;取得 参数 x 


eax DWORD PTR [eaxr eaxk 4+ 100] 

eax DNORD PTR [eaxt ecxt 

ebp ;撤销 堆栈 框架 
8 ;1V@1! 


从 上 述 目标 代码 可 知 ,最 后 的 返回 指令 ret 是 带 立 即 数 8 的 返回 指令 。 在 返回 的 同时 ,还 
使 得 堆栈 指针 寄存 器 ESP 加 8, 这 样 就 撤销 了 主 程序 调用 它 时 压 人 堆栈 的 参数 。 这 种 处 理 方 
式 ,更 加 需要 主 程序 和 子 程序 的 配合 协调 。 


习 题 
1. 请 指出 下 列 指令 的 错误 所 在 。 
(DW 以 5 (2)DV 13 
(3) AD 以 AL (4) R AL EX 
(5) XR OMA (6) TEST 3 
(DH EX (8) RR BD 


么 
3. 
4. 


a 


什么 是 除法 溢出 ? 如 何 解 决 32 位 被 除数 16 位 除数 可 能 产生 的 溢出 问题 ? 
说 明 符 号 扩展 和 零 扩 展 操 作 的 异同 ,并 列举 相关 的 操作 指令 。 
写 出 以 下 程序 片段 中 每 条 好 辑 运算 指令 执行 后 标志 ZF、SF 和 PF 的 状态 。 


WwW AL 4 
AD AL OH 

R A oH 
XR LA 

. 写 出 以 下 程序 片段 中 每 条 移 位 指令 执行 后 标志 CF、ZF、SF 和 PF 的 状态 。 

WwW AL 84H 

SR AL1 

SR AL1 

RR AL1 

RL AL1 

SH AL1 

RL AI1 

. 请 说 明 下 列 指令 片段 的 功能 。 

Xxor eax eaX 

mv al，[esp+r 习 
mv ecxX, eax 
shl eax8 

add eax ecx 
mov ecxX, eax 
shl eax 10h 
add eax ecx 


- 哪些 指令 把 寄存 器 ECX 作为 计数 器 ? 哪些 指令 把 寄存 器 CL 作为 计数 器 ? 


新 概念 汇编 语言 





8. 指令 “MOV AL,0” 使 寄存 器 AL 清 0。 写 出 至 少 另 外 4 条 可 使 寄存 器 AL 清 0 的 
指令 。 

9. 假设 寄存 器 EBX 内 容 为 2。 至 少 写 出 4 条 使 寄存 器 EBX 内 容 为 1 的 指令 。 

10. 指令 “MOV EDX,1” 使 寄存 器 EDX 内 容 为 1。 另外 写 出 3 个 使 寄存 器 EDX 内 容 为 
1 的 指令 片段 ,每 个 指令 片段 最 多 含有 两 条 指令 , 且 指 令 各 不 相同 (不 同 助 记 符 )。 

11. 假设 寄存 器 中 AL 含有 一 个 无 符号 整数 ,请 给 出 判断 该 数据 为 奇数 或 者 偶数 的 多 种 
方法 5 

12. 利用 算术 左 移 指令 或 算术 右 移 指令 可 以 实现 乘 或 除 计算 操作 ,这 与 使 用 乘法 指令 或 
除法 指令 进行 类 似 计算 操作 有 何 区 别 ? 

13. 与 利用 条 件 转移 指令 实现 循环 操作 相 比 ,采用 专门 的 循环 指令 实现 循环 操作 有 何 
优点 ? 

14. 实现 同一 功能 ,往往 有 多 种 方法 。 在 选择 方法 时 ,要 考虑 哪些 因素 ? 

15. 请 举例 说 明 如 何 利用 段 内 无 条 件 转移 指令 JMP 调用 子 程序 。 

16. 请 举例 说 明 如 何 利 用 返回 指令 RET 调用 子 程序 。 

17. 具有 何 种 特点 的 程序 片段 应 该 设计 成 子 程序 或 者 过 程 ? 

18. 设计 子 程 序 时 ,需要 注意 哪些 问题 ? 子 程序 说 明 信 息 应 包含 哪些 内 容 ? 

19. 主 程序 与 子 程序 之 间 如 何 传递 参数 ? 请 举例 说 明 每 种 方法 ,并 对 这 些 方 法 作 比 较 。 

20. 如 果 利 用 堆栈 传递 参数 ,那么 有 两 种 平衡 堆栈 的 方法 ,请 比较 这 两 种 方法 。 

21. 请 举例 说 明 堆栈 的 4 种 主要 用 途 。 列 举 一 个 能 够 同时 反映 这 些 用 途 的 示例 。 

22. 请 简要 说 明 C 语言 中 未 初始 化 局 部 变量 的 初 值 是 随机 值 的 原因 。 

23. 相对 转移 和 绝对 转移 的 区 别 是 什么 ”相对 转移 有 何 优 点 ? 

24. 直接 转移 和 间接 转移 各 自 有 何 特点 ?分 别 适用 于 哪些 场合 ? 

25. 请 画 出 3. 1 节 的 例 3-7 中 调用 函数 cf37 期 间 堆栈 的 变化 示意 图 。 

26. 参考 3. 2 节 的 例 3-16, 修 改 被 除数 的 尺寸 ,观察 除法 操作 溢出 的 结果 ; 尝试 把 被 除数 
扩展 到 64 位 ,观察 除法 操作 的 结果 。 

27. 参考 3.2 节 的 例 3-19, 删 除 函 数 cf311 中 的 强制 类 型 转换 ,然后 编译 生成 目标 代码 ,并 
进行 比较 分 析 。 

28. 参考 3. 3 节 的 例 3-43 ,删除 函数 cf319 中 case 4 及 以 上 的 分 支 情形 ,然后 编译 生成 目 
标 代码 ,并 进行 比较 分 析 。 

29. 参考 3.4 节 的 例 3-52 ,进一步 优化 嵌入 汇编 代码 as327 。 

30. 参考 3.4 节 的 例 3-54 ,修改 嵌入 汇编 代码 片段 as329 ,采用 其 他 排序 算法 。 

31. 参考 3.5 节 的 例 3-61 ,进一步 优化 嵌入 汇编 代码 as337 。 

32. 参考 3.5 节 的 例 3-64 演示 程序 dp339 ,调整 编译 选项 采用 “使 用 标准 Windows 库 ”， 
分 析 编 译 后 生成 的 目标 代码 。 

33. 采用 速度 最 大 化 的 编译 选项 ,编译 生成 如 下 函数 的 目标 代码 ,并 进行 观察 分 析 。 

char * mk char # dst, char value, unsigned int count) 

{ 

char * start= dst; 
while (count-- ) 
* dst++= value; 
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retum ( start) ; 
} 
34. 在 VC 2010 环境 下 ,编辑 运行 如 下 控制 台 程序 ,请 给 出 运行 结果 。 
#include < stdio.h> 
int vane 6; 
int buff[5]={ 1,2345} ; 
int mair() 


int var_a var_b, var_c; 


_asm{ 
MW EAX 6 
COAL SERI 
MV var a EAX 


锐 如 豆 如 多” 豆 当 估 玉 多 六 
§ 
要 


} 

printfk" D=%dE=%dF=%dn" , var a var_b, var c) ; 
retum 0; 

_asn{ 

SUBR1: 


灵 灵 办 思 四 
时时 


灵机 


有 上 
- 丁 习 导 理 百人 车 下 豆 豆 如 ”本 各 
和 





3 
巡 


} 

下 列 编程 题 ,除了 输入 和 输出 操作 之 外 ,请 采用 其 入 汇编 的 形式 实现 。 

35. 由 用 户 输入 一 个 无 符号 整数 ( 整 型 ); 统计 该 32 位 整数 中 位 值 为 0 的 个 数 ; 显示 输出 
统计 结果 。 

36. 由 用 户 输入 两 个 字符 (字符 型 ); 将 它们 视 为 两 个 8 位 数据 ,合并 成 一 个 16 位 无 符号 
整数 (arbrasbsasbsarb4asbsazbzabiaobo) ;显示 输出 合并 的 数据 。 

37. 由 用 户 输入 两 个 整数 ( 整 型 ); 分 别 取 得 它们 的 绝对 值 ,作为 新 数据 ; 交换 这 两 个 32 
位 数据 的 高 16 位 ,得 到 新 的 整数 ; 显示 输出 这 两 个 新 的 整数 。 

38. 由 用 户 从 键盘 输入 一 个 字符 串 ; 分 别 统 计 字符 串 中 英文 字母 ,十进制 数 字符 和 其 他 
符号 的 个 数 ; 显示 输出 统计 结果 。 

39. 由 用 户 从 键盘 输入 一 个 字符 串 ; 道 序 排列 字符 串 中 的 所 有 字符 ; 显示 输出 道 序 所 得 
字符 串 。 

40. 由 用 户 从 键盘 输入 一 个 字符 串 ; 删除 字符 串 中 的 所 有 非 英文 字母 ,形成 新 的 字符 串 
显示 输出 新 的 字符 串 。 

41. 由 用 户 从 键盘 输入 一 个 字符 串 ; 将 所 有 可 能 的 小 写字 母 转换 为 对 应 的 大 写字 母 ; 最 
后 显示 输出 字符 串 。 请 采用 子 程序 实现 把 可 能 的 小 写字 母 转换 为 大 写字 母 。 

42. 由 用 户 输入 一 个 十 进 制 整数 ( 整 型 ); 将 该 整数 转换 为 对 应 十 进 制 数 的 ASCII 码 字符 
串 ; 然后 显示 输出 所 得 字符 串 。 请 采用 子 程序 实现 把 整数 转换 为 十 进 制 数 的 字符 串 。 

43. 请 编写 程序 实现 : 由 用 户 从 键盘 输入 一 个 字符 串 ; 然后 测量 字符 串 长 度 ; 最 后 输出 
字符 串 长 度 。 要 求 输出 时 ,只 能 采用 字符 串 格式 ( 先 把 长 度 值 转换 为 对 应 的 十 进 制 数字 符 串 ) 。 

44. 由 用 户 输入 一 个 无 符号 十 进 制 整数 ( 整 型 ); 将 该 整数 转换 为 对 应 十 六 进 制 数 输出 。 
要 求 输出 时 ,只 能 采用 字符 串 格式 ( 先 转换 为 对 应 的 十 六 进 制 数字 符 串 ) 。 

45. 由 用 户 输 入 一 个 字符 ,分 别 用 十 进 制 数 形式 、 十 六 进 制 数 形式 和 二 进 制 数 形式 ,显示 
输出 其 对 应 的 ASCII 码 。 请 采用 合适 的 子 程序 。 要 求 输出 时 ,只 能 采用 字符 串 格 式 。 

46. 由 用 户 从 键盘 输入 一 个 字符 串 ; 然后 统计 字符 串 中 元 音字 母 的 个 数 ; 最 后 以 八进制 
数 形式 输出 统计 结果 。 请 采用 合适 的 子 程序 。 要 求 输出 时 ,只 能 采用 字符 串 格式 。 

47. 由 用 户 从 键盘 输入 一 个 十 进 制 数 字符 串 ( 假 设 不 含 其 他 字符 ); 然后 把 该 十 进 制 数字 
符 串 转换 成 对 应 的 数值 ; 接着 把 该 数值 转换 成 对 应 的 十 六 进 制 数字 符 串 ; 最 后 输出 十 六 进 制 
数字 符 串 。 请 采用 子 程序 实现 把 十 进 制 数字 符 串 转换 为 对 应 的 数值 。 

48. 由 用 户 以 字符 串 形 式 输入 一 个 十 六 进 制 数 (假设 其 不 含 其 他 字符 ) ,显示 输出 对 应 的 
十 进 制 数 。 请 采用 合适 的 子 程序 。 
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49. 由 用 户 输入 一 个 十 二 进 制 数 ,将 其 转换 为 十 三 进 制 数 输出 。 请 采用 合适 的 子 程序 。 
要 求 在 输入 和 输出 时 ,都 只 能 采用 字符 串 格式 。 

50. 由 用 户 从 键盘 先后 输入 两 个 自然 数 ; 然后 分 别 计算 这 两 个 数 的 和 、 差 、 积 ; 分 别 显示 
输出 结果 。 请 采用 合适 的 子 程序 。 要 求 在 输入 和 输出 时 ,都 只 能 采用 字符 串 格式 。 

51. 由 用 户 从 键盘 输入 两 个 自然 数 ; 然后 显示 输出 这 两 个 数 的 商 和 余数 。 请 采用 合适 的 
子 程序 。 要 求 在 输入 和 输出 时 ,都 只 能 采用 字符 串 格式 。 

52. 由 用 户 输 入 一 个 字符 串 ,其 中 可 能 含有 多 个 由 十 进 制 数 字符 构成 的 子 串 ,将 这 些 十 进 
制 数字 符 串 作为 数据 值 , 显 示 输 出 这 些 数据 之 和 。 假 设 字符 串 为 A123We56st002345, 其 各 数 
据 之 和 为 2524。 





字符 串 操作 和 位 操作 


为 了 提高 效率 ,IA-32 系列 处 理 器 提供 了 专门 的 字符 串 操作 指令 和 位 操作 指令 ,还 提供 了 
条 件 设置 字 节 指令 等 。 本 章 将 介绍 这 些 指令 及 其 应 用 。 


4.1 字符 串 操作 


字符 串 是 字符 的 一 个 序列 。 对 字符 串 的 操作 处 理 包括 复制 .比较 和 检索 等 。 为 了 高 效 地 
处 理 字符 串 ,IA-32 系列 CPU 提供 了 专门 处 理 字 符 串 的 指令 , 称 为 字符 串 操 作 指令 ,简称 串 操 
作 指 令 。 本 节 首 先 介绍 串 操 作 指 令 以 及 与 串 操作 指令 密切 相关 的 重复 前 绥 , 然 后 举例 说 明 如 
何 利用 它们 进行 字符 串 处 理 。 
4.1.1 字符 串 操作 指令 

1， 导 人 举例 

在 具体 介绍 字符 串 操 作 指 令 之 前 , 先 来 看 一 个 示例 ,以 便 说 明 相关 概念 。 

【 例 4-1】 如 下 程序 dp41 演示 串 操作 指令 的 使 用 ,其 中 的 两 段 戏 入 汇编 代码 采用 不 同 的 
方法 复制 字符 串 。 

#include < stdio h> 


int mair() 
{ 
char src_str[ 全 = ”abodefghijklm" ; // 源 字符 串 
char temp[ 14]; 
char dst_str[14]; /作为 目的 字符 串 
/第 一 种 方式 
_asm{ 
LEA ESI, sre_str /取得 源 串 起 始 地 址 
LEA 。 印 |，tem /取得 目的 串 起 始 地 址 
MW EX 14 /字符 串 长 度 
LAB1: 
MN AL, [ESD /从 源 串 取 一 个 字 节 
INC EI /调整 指向 源 串 的 指针 
MV [0D,AL // 复 制 到 目的 串 
IN BI /调整 指向 目的 串 的 指针 
LOOP LB1 /循环 处 理 
} 
/第 二 种 方式 


_asn{ // 使 用 串 操作 指令 的 方式 
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LEA ESI, src_str /取得 源 串 起 始 地 址 
LEA EI, dst_str /取得 目的 串 起 始 地 址 
MW EX {4 /字符 串 长 度 

NEXT: 
LODSB / 串 装 人 指令 /al 
STOSB / 串 存 储 指令 Me2 
LOOP NET /循环 处 理 

} 

MA/ 

printf" % SN\n”，terp) ; /显示 相同 的 字符 串 

printf" %s\n" ，dst_str) ; /显示 相同 的 字符 串 

return 0; 


] 

从 上 述 嵌入 汇编 代码 片段 可 知 ,第 二 种 方法 采用 了 字符 串 操作 指令 ,显得 更 加 简洁 高 效 。 
实际 上 ,一 条 串 装 人 指令 LODSB 相当 于 以 下 两 条 指令 的 功效 ,不 仅 从 源 串 取得 一 个 字符 ,而 
且 还 调整 指向 源 串 的 变 址 寄存 器 ESI, 使 得 它 指 向 下 一 个 字符 。 

WV AL [ES 
IN Esl 

类 似 地 ,一 条 串 存储 指令 STOSB 也 相当 于 两 条 指令 的 功效 。 

对 串 装 人 指令 LODSB 而 言 , 源 操作 数 是 存储 器 操作 数 , 目 的 操作 数 是 AL。 对 串 存 储 指 
令 STOSB 而 言 , 源 操作 数 是 AL, 目 的 操作 数 是 存储 器 操作 数 。 

2. 串 操作 指令 通用 说 明 

常用 的 串 操 作 指 令 有 5 种 ,分 别 是 串 装 入 指令 . 串 存储 指令 . 串 传送 指令 、. 串 扫描 指令 和 串 
比较 指令 。 此 外 ,还 有 串 输入 操作 指令 和 串 输出 操作 指令 。 每 种 串 操作 指令 包括 3 条 具体 指 
令 , 分 别 对 应 3 种 字符 尺寸 , 即 字 节 、 字 和 双 字 。 

在 字符 串 操作 指令 中 ,涉及 源 操 作 数 ( 串 ) 时 ,由 变 址 寄存 器 ESI 指向 源 串 ; 涉及 目的 操作 
数 ( 串 ) 时 ,由 变 址 寄存 器 EDI 指向 目的 串 。 在 涉及 源 操作 数 时 ,默认 引用 数据 段 寄存 器 DS; 
在 涉及 目的 操作 数 时 ,默认 引用 附加 段 寄 存 器 ES。 

因此 ,在 字符 串 操 作 指令 中 ,DS:ESI 指向 源 串 ,ES:EDI 指向 目的 串 。 如 果 只 有 一 个 数据 
段 或 者 目的 串 与 源 串 在 同一 个 段 (ES 与 DS 相同 ) .就 可 以 简单 地 认为 ,ESI 指向 源 串 ,EDI 指 
向 目的 串 。 

串 操作 指令 执行 时 会 自动 调整 作为 指针 使 用 的 寄存 器 ESI 或 EDI 的 值 ,使 其 指向 下 一 个 
字符 。 每 次 调整 的 尺寸 与 字符 串 中 字符 的 尺寸 一 致 。 如 果 串 操作 的 字符 尺寸 是 字 节 , 则 调整 
值 为 1; 如 果 字 符 尺 寸 是 字 , 则 调整 值 为 2; 如 果 字 符 尺寸 是 双 字 , 则 调整 值 为 4。 

字符 串 操作 的 方向 (处 理 字符 串 中 字符 的 次 序 ) 通 常 是 由 低地 址 向 高 地 址 ,但 也 可 以 由 高 
地 址 向 低地 址 。 

字符 串 操 作 的 方向 由 标志 寄存 器 中 的 方向 标志 DF 控制 。DF 是 方向 标志 (Direction 
Flag) ,处 于 标志 寄存 器 的 位 10, 也 即 图 2. 3 所 示 的 控制 标志 位 。 对 字符 串 操 作 指 令 而 言 , 当 
方向 标志 DF 复位 (为 0) 时 ,操作 方向 是 由 低 向 高 , 按 递增 方式 调整 寄存 器 ESI 或 EDI 的 值 ; 
当 方向 标志 DF 置 位 (为 1) 时 ,操作 方向 是 由 高 向 低 , 按 递减 方式 调整 寄存 器 ESI 或 EDI 
的 值 。 

有 专门 的 指令 设置 标志 寄存 器 中 的 方向 标志 DF。 





清 方向 标志 DF 的 指令 如 下 : 
oD 
设置 方向 标志 DF 的 指令 如 下 : 
sD 
利用 这 两 条 指令 ,可 以 根据 需要 调整 字符 串 操 作 指 令 处 理 字符 串 的 方向 。 
3. 字符 串 装 人 指令 (LOAD String) 


字符 串 装 人 指令 的 格式 如 下 : 
LODSB ; 装 人 字 节 ( Byte) 
LODSW ; 装 人 字 ( Word) 
LODSD ; 装 人 双 字 ( Dauble Word) 


字符 串 装 人 指令 把 字符 串 中 的 一 个 字符 装 人 到 累加 器 中 。 该 指令 不 影响 状态 标志 。 
字 节 装 人 指令 LODSB 把 寄存 器 ESI 所 指向 的 一 个 字 节 数 据 装 人 到 累加 器 AL 中 ,然后 
根据 方向 标志 DF 复位 或 置 位 使 ESI 的 值 增 1 或 减 1。 它 类 似 下 面 的 两 条 指令 : 
MV AL [ESN] 
IN ESI 或 DEC ESI 
字 装 入 指令 LODSW 把 寄存 器 ESI 所 指向 的 一 个 字数 据 装 入 到 累加 器 AX 中 ,然后 根据 
方向 标志 DF 复位 或 置 位 使 ESI 的 值 增 2 或 减 2。 类 似 于 如 下 的 两 条 指令 ， 
MW 以 [ES 
AD Esl,2 或 SB Esl,2 
双 字 装 入 指令 LODSD 把 寄存 器 ESI 所 指向 的 一 个 双 字数 据 装 人 到 累加 器 EAX 中 ,然后 
根据 方向 标志 DF 复位 或 置 位 使 ESI 的 值 增 4 或 减 4。 类 似 于 如 下 的 两 条 指令 ， 


WW EMX [ES 

AD Esl,4 或 SB Esl,4 
4. 字符 串 存储 指令 (STOre String) 
字符 串 存 储 指令 的 格式 如 下 : 

STOSB 存储 字 节 

STOSW 将 储 字 

SmSD 将 储 双 字 


字符 串 存储 指令 只 是 把 累加 器 的 值 存 到 字符 串 中 , 即 替 换 字符 串 中 一 个 字符 。 字 符 串 存 
储 指令 不 影响 状态 标志 。 

字 节 存储 指令 STOSB 把 累加 器 AL 的 内 容 送 到 寄存 器 EDI 所 指向 的 存储 单元 中 ,然后 
根据 方向 标志 DF 复位 或 置 位 使 EDI 的 值 增 1 或 减 1。 字 存储 指令 STOSW 把 累加 器 AX 的 
内 容 送 到 寄存 器 EDI 所 指向 的 存储 单元 中 ,然后 根据 方向 标志 DF 使 EDI 的 值 增 2 或 减 2。 
双 字 存储 指令 STOSD 把 累加 器 EAX 的 内 容 送 到 寄存 器 EDI 所 指向 的 存储 单元 中 ,然后 根据 
方向 标志 DF 使 EDI 的 值 增 4 或 减 4。 

字符 串 存储 指令 的 源 操 作 是 累加 器 AL、AX 或 EAX, 目 的 操作 是 存储 器 操作 数 ,自动 引 
用 附加 段 寄存 器 ES。 

【 例 4-2】 如 下 的 嵌入 汇编 代码 as42 同样 实现 例 4-1 中 dp41 的 嵌入 汇编 代码 功能 。 

/ 马 和 汇编 代码 as@ 
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/假设 号 0; 假设 数据 段 寄 存 器 区 与 附加 段 寄存 器 鲜 相 同 


_asm{ 
LEA ESI, src str /取得 源 串 起 始 地 址 
LEA EI, dst_str /取得 目的 串 起 始 地 址 
MV EX 3 /字符 串 长 度 

NEXT: 
LODSD / 取 一 个 双 字 ( 4 个 字 节 ) 
STOSD / 存 一 个 双 字 ( 4 个 字 节 ) 
LP NET /循环 处 理 
LODSW W 取 一 个 字 ( 2 个 字 节 ) 
STOSW / 存 一 个 字 ( 2 个 字 节 ) 


} 

上 述 租 入 汇编 代码 通过 每 次 处 理 一 个 双 字 ,减少 循环 的 执行 次 数 , 从 而 提高 效率 。 在 循环 
执行 3 次 后 ,还 有 两 个 字 节 需要 处 理 ,所 以 在 最 后 取 一 个 字 , 存 一 个 字 。 

5. 字符 串 传送 指令 (MOVe String) 


字符 串 传送 指令 的 格式 如 下 : 
MDAB 学 节 传 送 
MOMSW 学 传送 
MMSD ; 双 字 传送 


字 节 传送 指令 MOVSB 把 寄存 器 ESI 所 指向 的 一 个 字 节 数 据 传 送 到 由 寄存 器 EDI 所 指 
向 的 存储 单元 中 ,然后 根据 方向 标志 DF 复位 或 置 位 使 ESI 和 EDI 的 值 分 别 增 1 或 减 1。 它 
类 似 于 如 下 指令 片段 ,但 不 会 影响 AL。 
LODSB 
STOSB 
字 传送 指令 MOVSW 把 寄存 器 ESI 所 指向 的 一 个 字数 据 传 送 到 由 寄存 器 EDI 所 指向 的 
存储 单元 中 ,然后 根据 方向 标志 DF 使 ESI 和 EDI 的 值 分 别 增 2 或 减 2。 双 字 传 送 指令 
MOVSD 把 寄存 器 ESI 所 指向 的 一 个 双 字 数据 传送 到 由 寄存 器 EDI 所 指向 的 存储 单元 中 , 然 
后 根据 方向 标志 DF 使 ESI 和 EDI 的 值 分 别 增 4 或 减 4。 
字符 串 传 送 指令 不 影响 标志 。 
该 指令 的 源 操作 数 和 目的 操作 均 在 存储 器 中 ,这 属于 特殊 情况 。 
【 例 4-3】〗 如 下 的 嵌入 汇编 代码 as43 同样 实现 例 4-1 中 dp41 的 嵌入 汇编 代码 功能 ,由 于 
采用 字符 串 传 送 指令 ,这样 效 率 更 高 。 


// 占 入 汇编 代码 as43 
/假设 呈 0; 假设 数据 段 寄存 器 哈 与 附加 段 寄 存 器 臣 相 同 
_asm{ 
LEA ESI, src_ str /取得 源 串 起 始 地 址 
LEA EI, dst_str /取得 目的 串 起 始 地 址 
MW EX3 /字符 串 长 度 
NEXT: 
MOVSD /传送 一 个 双 字 ( 4 个 字 节 ) /ae1 


LOOP NET /循环 处 理 Ma2 





MOMSW /传送 一 个 字 ( 2 个 字 节 ) 


6. 字符 串 扫描 指令 (SCAn String) 


字符 串 扫 描 指令 的 格式 如 下 : 
SOSB 音字 节 扫 描 
SSW 音字 扫描 
SSD 音 双 字 扫 描 


串 字 节 扫 描 指 令 SCASB 把 累加 器 AL 的 内 容 与 由 寄存 器 EDI 所 指向 一 个 字 节 数据 采用 
相 减 方式 比较 , 相 减 结果 反映 到 各 状态 标志 (CF、ZF、OF、SF、PF 和 AF) ,但 不 影响 两 个 操作 
数 , 然 后 根据 方向 标志 DF 复位 或 置 位 使 EDI 的 值 增 1 或 减 1 。 

串 字 扫描 指令 SCASW 把 累加 器 AX 的 内 容 与 由 寄存 器 EDI 所 指向 的 一 个 字数 据 比较 ， 
结果 影响 标志 ,然后 EDI 的 值 增 2 或 减 2。 串 双 字 扫描 指令 SCASD 把 累加 器 EAX 的 内 容 与 
由 寄存 器 EDI 所 指向 的 一 个 双 字 数据 比较 ,结果 影响 标志 ,然后 EDI 的 值 增 4 或 减 4。 

【 例 4-4】 如 下 程序 dp44 演示 字符 串 扫 摘 指令 的 使 用 ,其 嵌入 汇编 代码 的 功能 是 判断 字 
符 变 量 varch 中 的 字符 是 否 为 十 六 进 制 数 符 号 ,并 根据 判断 结果 设置 变量 flag 的 值 。 

#include < stdioh> 

int mair() 

{ 

char string[ ]= " 0123456789ABCDEFabodef” ; 


char vardF %'; /用 于 保存 其 他 方式 输入 的 字符 
int flag; /反映 是 否 为 十 六 进 制 数 符号 
Wh 
_asn{ 
MN ”AL varch ;把 要 判断 的 字符 送 至 AL 
MW EX 22 ;合计 2 个 十 六 进 制 数 符 号 
LEA BI, string 
NEXT: 
SCASB ; Ma1 
LOOPNZ NET ;没有 找 遍 且 没有 找到 ,继续 找 Ma2 
JZ “NT FIUUND ;没有 找到 
FOUND: ;找到 ,字符 是 十 六 进 制 数 符号 
MV flag 1 
JWP ”SHORT OR 
NOT_FOUND: 学 符 不 是 十 六 进 制 数 符号 
MV flag 0 
OR: 
} 
printfk" flag= % d\n" , flag) ; /显示 为 flag=0 
return 0; 


] 

在 上 述 骨 入 汇编 代码 中 ,注释 有 “//@1” 和 “//@2” 的 指令 是 关键 的 两 条 指令 。 首 先 利 用 
字符 串 扫描 指令 SCASB 比较 , 它 会 影响 状态 标志 ZF; 接着 利用 循环 指令 LOOPNZ 控制 循 
环 , 它 根据 ZF 和 ECX 决定 是 否 继续 循环 。 最 后 紧 随 的 条 件 转移 指令 JNZ 区 分 循环 结束 的 原 
因 : 找到 提前 结束 循环 ; 找 遍 了 ,没有 找到 。 
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7. 字符 串 比 较 指 令 (CoMPare String) 


字符 串 比 较 指 令 的 格式 如 下 : 
OPSB ; 串 字 节 比 较 
OPSY 音字 比较 
QPD ; 串 双 字 比较 


串 字 节 比较 指令 CMPSB 把 寄存 器 ESI 所 指向 的 一 个 字 节 数据 与 由 寄存 器 EDI 所 指向 的 
一 个 字 节 数据 采用 相 减 方式 比较 , 相 减 结果 反映 到 各 状态 标志 (CF、ZF、OF、SF、PF 和 AF)， 
但 不 影响 两 个 操作 数 , 然 后 根据 方向 标志 DF 复位 或 置 位 使 ESI 和 EDI 的 值 分 别 增 1 或 减 1。 

串 字 比较 指令 CMPSW 把 寄存 器 ESI 所 指向 的 一 个 字数 据 与 由 寄存 器 EDI 所 指向 的 一 
个 字数 据 比较 ,结果 影响 标志 ,然后 按 调整 值 2 调整 ESI 和 EDI 的 值 。 串 双 字 比较 指令 
CMPSD 把 寄存 器 ESI 所 指向 的 一 个 双 字 数据 与 由 寄存 器 EDI 所 指向 的 一 个 双 字 数据 比较 ， 
结果 影响 标志 ,然后 按 调整 值 4 调整 ESI 和 EDI 的 值 。 

字符 串 比 较 指令 CMPS 和 字符 串 传送 指令 MOVS , 源 操作 数 和 目的 操作 数 都 是 存储 器 操 
作 数 ,这 是 特殊 情况 。 


4.1.2 重复 操作 前 绥 


由 于 串 操作 指令 每 次 只 能 处 理 字符 串 中 的 一 个 字符 ,因此 在 上 述 示 例 中 ,往往 采用 一 个 循 
环 ,来 实现 对 整个 字符 串 的 处 理 。 为 了 进一步 提高 效率 ,IA-32 系列 CPU 还 提供 重复 操作 前 
级 。 重 复 操作 前 级 可 加 在 字符 串 操 作 指 令 之 前 ,起 到 重复 执行 其 后 的 一 条 字符 串 操 作 指 令 的 
作用 。 

1. 重复 前 级 REP 

REP 用 作为 一 个 串 操 作 指 令 的 前 级 , 它 重 复 其 后 的 串 操作 指令 动作 。 每 一 次 重复 都 先 判 
断 寄存 器 ECX 是 否 为 0, 如 果 为 0 就 结束 重复 ,否则 ECX 的 值 减 1, 重 复 其 后 的 串 操 作 指令 。 
所 以 当 ECX 值 为 0 时 ,就 不 执行 其 后 的 字符 串 操作 指令 。 

它 类 似 于 LOOP 指令 ,但 LOOP 指令 是 先 把 ECX 的 值 减 1 后 再 判 是 否 为 0。 

注意 ,在 重复 过 程 中 的 ECX 减 1 操作 ,不 影响 各 状态 标志 。 

重复 前 级 REP 主要 用 在 串 传送 指令 MOVS 和 串 存储 指令 STOS 之 前 。 

【 例 4-5】 利用 重复 前 缀 REP, 改 写 例 4-3 的 嵌入 汇编 代码 as43。 

把 例 4-3 的 如 下 两 条 指令 : 


MOVSD // 传 送 一 个 双 字 ( 4 个 字 朝 Ma1 

LOOP NE /循环 处 理 Ma 2 
改写 成 如 下 所 示 的 一 条 指令 : 

RP MVSD /重复 执行 ( ECY 次 MVSD 操作 


这 样 做 可 以 使 得 代码 更 简洁 ,效率 更 高 。 
【 例 4-6】 如 下 汇编 代码 片段 演示 利用 重复 前 级 REP 和 串 存 储 指令 的 配合 ,快速 初始 化 
某 一 内 存 区 域 。 
;假设 作为 目的 段 附加 段 寄 存 器 已 有 合适 内 容 
;假设 方向 标志 D0 
LEA 。 印 |，DWORD PTR [EBP- 100] ;准备 填充 区 域 首 地 址 
MW EX ;准备 计数 值 





MY ”EAX 000000000H ;准备 填充 值 
RP STOSD ;快速 填充 


2. 重复 前 级 REPE/REPZ 
REPE 与 REPZ 是 一 个 前 级 的 两 个 助 记 符 , 下 面 以 REPE 为 代表 进行 说 明 。 
REPE 作为 一 个 串 操 作 指 令 的 前 级, 它 重 复 其 后 的 串 操 作 指 令 动作 。 每 重复 一 次 , ECX 
的 值 减 1, 重 复 一 直 进行 到 ECX 为 0 或 串 操作 指令 使 零 标志 ZF 为 0 时 止 。 只 有 当 相 等 (ZF 
为 1) 时 , 才 有 可 能 继续 重复 。 
在 开始 重复 前 ,会 先 判断 ECX 是 否 为 0。 在 重复 过 程 中 ,ECX 值 减 1 操作 ,并 不 影响 状态 
标志 (包括 ZF 标志 ) 。 
重复 前 级 REPE 主要 用 在 串 比较 指令 CMPS 和 串 扫 描 指 令 SCAS 之 前 。 由 于 串 传送 指 
令 MOVS 和 串 存储 指令 STOS 都 不 影响 标志 ,因此 在 这 些 串 操作 指令 前 使 用 前 级 REP 和 前 
级 REPE 的 效果 一 样 。 
【 例 4-7】 如 下 汇编 代码 as45 ,演示 利用 重复 前 级 REPE 和 串 扫描 指令 SCAS 的 配合 , 跳 
过 字符 串 开 始 部 分 的 空格 符 。 
假设 有 如 下 的 指针 变量 ,已 经 被 初始 化 ,并 指向 某 个 字符 串 : 
char * ptobuff; 
租 入 汇编 代码 片段 as45 如 下 所 示 : 
_asm{ 
; 设 已 经 清 方向 标志 呈 
没 氏 与 8 已 经 一 致 


WY EDl, ptobuff : 取 指向 目的 串 的 指针 初 什 
MW EX -1 ;使 得 EDe OFFFFFFFFH //@1 
MW A 2H ;空格 符号 

REPE SCASB 各 复 扫描 空格 符 /@2 
Dp BI ;1 V@3 

WY ptabuff DI :保存 定位 后 的 指针 


] 

在 上 述 代码 片段 中 ,注释 带 “//@1” 的 行 ,使 得 寄存 器 ECX 足够 大 ,在 某 种 意义 上 能 够 超 
过 任意 字符 串 的 长 度 。 带 “//@2” 的 行 , 重 复 扫描 空格 符 , 直 到 遇 到 非 空格 符 或 者 扫描 到 字符 
串 尾 。 由 于 每 执行 串 操作 指令 一 次 ,指针 都 会 自动 调整 ,因此 不 论 字 符 是 否 匹配 ,都 需要 安排 
带 //@3 的 行 ,使 得 EDI 指向 字符 串 中 第 一 个 非 空格 符 (或 者 字符 串 结束 标记 ) 。 

在 例 3-48 也 是 实现 类 似 功 能 的 汇编 代码 片段 ,请 进行 比较 。 

3. 重复 前 级 REPNE/REPNZ 

REPNE 与 REPNZ 是 一 个 前 缀 的 两 个 助 记 符 ,下 面 以 REPNE 为 代表 进行 介绍 。 

REPNE 作为 一 个 串 操作 指令 的 前 缀 。 与 REPE 类 似 ,所 不 同 的 是 重复 一 直 进 行 到 ECX 
为 0 或 串 操作 指令 使 零 标 志 ZF 为 1 时 止 。 只 有 当 不 等 (ZF 为 0) 时 , 才 有 可 能 继续 重复 。 

重复 前 级 REPNE 主要 用 在 字符 串 扫描 指令 SCAS 之 前 。 重复 前 级 REPNE 与 SCASB 
指令 配合 ,表示 当 不 等 时 继续 扫描 ,一 直 搜 索 到 字符 串 结束 。 如 果 搜 索 到 , 则 ZF 标志 为 1， 


第 4 章 字符 串 操作 和 位 操作 37 





ECX 的 值 可 能 为 0; 如 果 没 有 搜索 到 , 则 ZF 标志 为 0,ECX 的 值 一 定 为 0。 
4.1.3 应 用 举例 


下 面 举 几 个 示例 来 说 明 如 何 进 行 字符 串 操 作 , 同 时 进一步 演示 字符 串 操作 指令 和 重复 前 
组 的 使 用 。 

【 例 4-8】 演示 另 一 个 测量 字符 串 长 度 的 方法 。 如 下 程序 dp46 利用 重复 前 级 REPNE 和 
串 扫 描 指 令 SCASB 的 结合 ,测量 字符 串 的 长 度 。 


#include < stdio.h> 

int mir() 

{ 
char string[100] ; /用 于 存放 字符 串 
int len; /用 于 存放 字符 串 长 度 
printf”Irput string:" ) ; /由 用 户 输入 一 个 字符 串 
scanf" %s" , strine) ; 
/嵌入 汇编 代码 


LEA EM strirg /使 得 印 | 指向 字符 串 


retum 0; 


汉 能 :测量 字符 串 长 度 

;入 口 参数 : 堆栈 传递 字符 串 起 始 地 址 偏 移 
出口 参数 : ENE 字符 串 长 度 ( 不 包括 结束 标记 ) 
;说 。 明 : 设 字符 串 以 空 ( 值 0) 为 结束 标记 


影响 寄存 器 EMX 和 EX 
SIRAN: 
RSH EP 
WW ”EBP EP ;建立 堆栈 框架 
PUSH BI ;保护 寄存 器 
MW EI, [EBP+ 引 ;取得 入 口 参数 
XR ALA =d 字 符 串 结束 标记 值 ) 
MW EX -1 ;假设 字符 串 足 够 长 ( OFFFFFFFFH) 
REFNZ SCASB ;寻找 字符 串 结 束 标记 
NT EX 
pC EX ;至 此 EX 含 字符 串 长 度 
;EX 初 值 OFFFFFFFFH, 所 以 要 减 1 
MOV EAX EX ;准备 返回 参数 
POP EI 恢复 寄存 器 





;撤销 堆栈 框架 


图 


POP 
FET 
} 
] 
本 例 与 例 3-49 类 似 , 所 不 同 的 是 ,这 里 采用 了 字符 串 操 作 指令 和 重复 前 级 寻找 字符 串 结 
东 标 记 , 而 且 测 量 字符 串 长 度 部 分 的 代码 采用 了 子 程 序 的 形式 。 另 外 需要 注意 ,与 例 3-49 的 
dp323 相 比 , 由 于 重复 前 级 先 判 断 ECX 是 否 为 0, 所 以 ECX 的 初 值 被 设置 成 最 大 的 
0FFFFFFFFH ,因此 在 根据 ECX 值 推算 字符 串 长 度 时 ,要 减 1。 
【 例 4-9】 编写 一 个 移动 (复制 ) 数 据 块 的 子 程序 。 子 程序 有 3 个 人 口 参数 ,分 别 为 目的 地 
起 始 地 址 、 源 数据 块 起 始 地 址 .数据 块 长 度 ( 字 节 数 ) 。 
值得 指出 的 是 , 源 数据 块 区 域 与 目的 地 区 域 可 能 出 现 部 分 重 又 ,也 就 是 目的 地 起 始 地 址 界 
于 源 数据 块 范围 内 。 当 出 现 这 种 情况 时 ,移动 (复制 ) 过 程 就 不 能 简单 地 从 低地 址 向 高 地 址 调 
整 ,而 需要 从 高 地 址 向 低地 址 调整 。 
采用 嵌入 汇编 代码 编写 的 子 程序 as47 如 下 所 示 : 
/ 伐 入 汇编 代码 as47 
asm{ 
; 池 程 序 名 : BWWE 
; 功 能 : 移动 (复制 ) 数据 块 
;人 口 参数 : (1) 堆栈 传递 目的 地 起 始 地 址 偏 移 
(2) 堆栈 传递 源 数 据 块 起 始 地 址 偏 移 
( 3) 数据 块 长 度 ( 字 节 数 ) 
出口 参数 : EAe 目的 地 起 始 地 址 偏 移 
;说 明 : 设 字符 串 以 空 ( 值 9 为 结束 标记 
影响 寄存 器 EX.EX 和 EX 


MEMWNE: 
RH EP ;建立 堆栈 框架 
WwW EP b 
psH EI ;保护 寄存 器 
PusH BBS ;保护 寄存 器 
MX ESI, [EEP+ 们 ;ESE= 源 数 据 块 起 始 地 址 偏 移 
MY EX [EBP+ 16] :EOE 移动 数据 块 的 长 度 ( 字 节 数 ) 
WW EI, [EP+ 引 ;BDI= 目的 地 起 始 地 址 偏 移 
MW EMX EX ;EAE 长 度 ( 字 节 数 ) 
MOV EX EX ;ED 长度 ( 字 节 数 ) 
AD EMX ESI :EAE 源 数据 块 末尾 后 
OP EI, EI ;目的 起 始 地 址 <= 源 起 始 地 址 吗 ? 
JE Copyp 湿 ,由 低 端 向 高 端 复制 
OP BI, EX ;目的 起 始 地 址 < 源 数据 块 末 尾 后 吗 ? 
JB Cppom 间 , 由 高 端 向 低 端 复制 
Copyb: ;由 低 端 向 高 端 复制 
Dword_al ign: 


长 度 ( 字 节 数 ) 转换 成 双 字数 


多 
肌 
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RP MVSD ; 双 字 为 单位 移动 ( 复制 ) 
AD EX 3 长 度 %《 余 数 ) 
由 Trailup0 整除 ,不 用 处 理 零头 
Trailup3: ==== 最 多 剩余 3 个 字 节 
SR BEBX1 ; 除 以 2 
由 Trail 六 0 表示 剩余 一 个 字 节 
Trailup2: ==== 剩 余 3 个 或 2 个 字 节 
MMSW ;复制 2 个 字 节 
JNC Trailup0 ;OF= 0, 表示 刚才 被 2 整除 
Trailup1: ==== 剩 余 一 个 字 节 
MOVSB 复制 一 个 字 节 
Trai IUpO: 
JP ”SHORT ToRet 准备 返回 
CopyDom 
LEA ESI, [ESI+ EX- 习 ;ESI= 源 数 据 块 未 尾 -4 
LEA EI, [DI+ EOc 习 ;EDI= 目的 地 末尾 -4 
SR EX 2 长 度 ( 字 节 鸥 转换 成 双 字 数 
sD ; 置 方向 标志 串 操 作 方 向 由 高 向 低 ) 
RP MVD ; 双 字 为 单位 移动 
AD EX 3 长 度 %4《 余数) 
由 TrailDow0 整 除 ,不 用 处 理 零头 
TrailDowm3: 
IN ESI ; 先 调整 指针 Ma1 
INC BI 
IN ESI 
IN BI 
SR EX1 ==== 最 多 剩余 3 个 字 节 
由 TrailDpomf 为 0 表示 剩余 一 个 字 节 
TrailDow2: 二 === 剩 余 3 个 或 2 个 字 节 
MOVSW ;复制 2 个 字 节 
JC TrailDow0 
TrailDowm1: 
IN EI ; 先 调整 指针 Ma2 
IN BI 
MOVSB ;复制 一 个 字 节 
TrailDow0: 
oD ; 清 方向 标志 呈 
ToRet: 
POP EI 恢复 寄存 器 
PP BI 
WW EM [EEP+ gd ;准备 出 口 参数 
POP EP :撤销 堆栈 框架 
RET 


上 述 代 码 ,在 从 堆栈 取得 入 口 参数 后 ,首先 判断 源 数 据 块 区 域 与 目的 地 区 域 是 否 出 现 重 
春 。 如 果 不 重 橙 , 就 由 低 向 高 依次 移动 (复制 ); 否则 ,就 由 高 向 低 依次 移动 (复制 )。 为 了 提高 
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执行 效率 , 尽 可 能 实施 双 字 移动 ,然后 再 处 理 可 能 出 现 的 零头 (最 多 3 个 字 节 )。 从 代码 中 可 
知 , 如 果 是 由 高 向 低 依次 移动 ,在 处 理 零 头 时 ,就 会 比较 麻烦 。 实 际 上 ,在 重复 串 操 作 结束 后 ， 
指针 并 非 指向 剩余 的 零头 字 节 ,所 以 需要 额外 调整 指针 。 为 了 使 得 字符 串 操作 方向 由 高 向 低 ， 
设置 了 方向 标志 DF ,处 理 结束 后 ,清除 方向 标志 DF。 


4.2 位 操 作 


无 论 在 表示 、 存 储 或 者 处 理 时 ,位 (bit) 是 计算 机 系统 中 最 基本 的 单位 。 一 个 二 进 制 位 能 
表示 两 种 状态 : 0 或 者 1。 在 C 语言 中 ,一 个 字符 型 数据 ,由 8 位 表示 , 占 一 个 字 节 存储 单元 。 
所 谓 32 位 处 理 器 ,其 主要 特征 就 是 大 部 分 寄存 器 是 32 位 ,一 次 处 理 数 据 的 位 数 是 32 位 。 在 
C 语言 中 ,有 一 组 按 位 逻辑 运算 符 ,能 够 实现 按 位 逻辑 运算 。 在 3. 2 节 中 介绍 的 逻辑 运算 指令 
和 移 位 指令 等 ,能 够 实现 以 位 为 单位 的 操作 。 为 了 提高 位 操作 的 效率 ,IA-32 系列 CPU 还 提 
供 专门 的 位 操作 指令 。 


4.2.1 位 操作 指令 


位 操作 指令 可 分 为 两 组 : 位 测试 及 设置 指令 组 和 位 扫描 指令 组 .利用 这 些 位 操作 指令 ， 
可 以 直接 对 二 进 制 位 进行 测试 、 设 置 和 扫描 等 操作 。 
1. 导入 举例 
在 具体 介绍 位 操作 指令 之 前 , 先 来 看 一 个 示例 ,以 便 说 明 相关 概念 。 
【 例 4-10】 如 下 程序 dp48 演示 针对 二 进 制 位 的 操作 处 理 。 其 中 ,两 个 位 串 分 别 长 64 位 ， 
由 8 个 字 节 构成 。 演 示 步 又 为 : 采用 逻辑 运算 指令 OR ,把 bitstrl 中 的 第 17 位 和 第 43 位 设 
置 成 1; 采用 位 操作 指令 BTS, 把 bitstr2 中 的 第 17 位 和 第 43 位 设置 成 1。 
#include < stdio h> /演示 程序 dp%8 
void echo_bit6( nsigned char * bit64) ; 
unsigned char bitstri[8]={ 00000000] ; 
unsigned char bitstr2[8]={ 00000000] ; 
int mairn() 
{ 
/嵌入 汇编 代码 一 
EDX bitstr1 ;取得 位 串 1 的 基地 址 
;设置 位 串 中 的 第 人 7 位 


和 


EAX 1 
EX 17 
EAX QO 


“9p 


设置 位 串 中 的 第 名 位 
EAX1 
EX4- 了 
EAXQL 
DWORD PTR [EDX+ 4], EAX 


另 人 各 各 


} 
echo_bité4 bitstr1) ; /显示 为 0000080000020000 
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_asmf /嵌入 汇编 代码 二 
LEA EX bitstr2 ;取得 位 串 2 的 基地 址 
;设置 位 串 中 的 第 人 7 位 
WW ECX 17 
BTS DW PIR [DX], EX ;位 操作 指令 
;设置 位 串 中 的 第 名 位 
WW EX 4-22 
BTS DWORD PTR [EDX+ 1], EX ;位 操作 指令 
echo_bitgk bitstr2) ; /显示 为 0000080000020000 
retumn 0; 


} 
/函数 bit4 功 能 是 ,以 十 六 进 制 数 的 形式 显示 多 位 的 位 串 
void echo_bité4 unsigned char * pc) 
f 
printg”% OBx" , * (( unsigned int*) ( pct))) ) ; 
printR" % CBAn" , * (( unsigned intk) pc) ) ; 
return; 
} 


上 述 演 示 程 序 dp48 运行 过 程 中 ,在 设置 过 17 位 和 43 位 后 ,两 个 位 串 bitstrl 和 bitstr2 的 
情形 如 图 4. 1 所 示 。 注 意 , 位 串 的 起 始 位 号 是 0。 如果 位 串 占 用 多 个 字 节 ,那么 同样 适用 “高 
高 低 低 ”原则 ,也 就 是 高 字 节 在 高 地 址 存储 单元 , 低 字 节 在 低地 址 存储 单元 。 
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图 4.1 例 4-10 中 位 串 bitstr 的 示意 图 


从 上 述 租 入 汇编 代码 一 可 知 ,为 了 设置 第 43 位 ,通过 调整 存储 单元 有 效 地 址 的 方式 ,操作 
位 于 高 地 址 的 第 二 个 双 字 。 位 串 的 第 43 位 ,就 是 第 二 个 双 字 中 的 第 11 位 。 

从 上 述 嵌 入 汇编 代码 二 可 知 , 第 二 种 方法 采用 了 位 操作 指令 ,显得 更 加 简洁 高 效 。 指 令 
BTS 能 够 直接 设置 位 串 中 指定 的 位 。 

2. 位 测试 及 设置 指令 组 

位 测试 和 设置 指令 组 含有 4 条 指令 : 位 测试 (Bit Test) 指 令 BT、 位 测试 并 取 反 (Bit Test 
and Complement) 指 令 BTC 位 测试 并 复位 (Bit Test and Reset) 指 令 BTR 和 位 测试 并 置 位 
(Bit Test and Set) 指 令 BTS 。 

这 4 条 位 测试 及 设置 指令 的 格式 如 下 : 


钉 OD OFD2 
Be Om OFD2 
BR Oi om 
BS OD 07D2 
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其 中 ,操作 数 OPRD1 指定 位 串 ,操作 数 OPRD2 指定 位 号 。 操 作 数 OPRD1 可 以 是 16 位 
或 32 位 通用 寄存 器 ,也 可 以 是 16 位 或 32 位 存储 单元 地 址 。 操 作 数 OPRD2 可 以 是 操作 数 
OPRD1 尺寸 相同 的 通用 寄存 器 ,也 可 以 是 8 位 立即 数 。 

位 测试 指令 BT 的 功能 是 ,把 被 测试 位 的 值 送 到 进位 标志 CF。 

位 测试 并 取 反 指令 BTC 的 功能 是 ,把 被 测试 位 的 值 送 到 进位 标志 CF, 并 且 把 被 测试 位 
取 反 。 

位 测试 并 复位 指令 BTR 的 功能 是 ,把 被 测试 位 的 值 送 到 进位 标志 CF ,并 且 把 被 测试 位 复 
位 , 即 清 0。 

位 测试 并 置 位 指令 BTS 的 功能 是 ,把 被 测试 位 的 值 送 到 进位 标志 CF ,并 且 把 被 测试 位 置 
位 , 即 置 1 。 

标志 寄存 器 中 的 状态 标志 ZF、SF、OF、AF 和 PF 无 定义 。 

如 果 给 出 被 测 位 串 的 操作 数 OPRD1 是 32 位 (或 16 位) 寄存 器 ,那么 被 测 位 串 也 就 限于 
32 位 (或 16 位) ,因此 实际 的 被 测 位 号 将 是 操作 数 OPRD2 取 32( 或 16) 的 余数 。 

【 例 4-11】 如 下 指令 片段 演示 位 测试 及 设置 指令 的 使 用 ,分 号 后 的 注释 给 出 指令 执行 后 
进位 标志 CF 和 相关 寄存 器 的 内 容 。 


WW DX 364 DE 3454H 

BC 以 5 ;OF=0 De WH 

MV CQX18 

BR MX ;GF=1, DE 342 被 测 位 号 是 2) 
MV EX 3 

BS EX EX ;=0 DE 34AH 

BH EX :GE=1, DE 34M 被 测 位 号 是 9 


如 果 给 出 被 测 位 串 的 操作 数 OPRD1 是 32 位 (或 16 位 ) 存 储 单元 的 地 址 ,那么 意味 着 被 
测 的 位 串 在 存储 器 中 。 存 储 器 中 的 被 测 位 串 可 以 足够 长 ,可 以 是 多 个 32 位 (或 16 位 )。 在 这 
种 情况 下 ,实际 被 测 的 32 位 存储 单元 (或 16 位 存储 单元 ) 的 地 址 ,将 在 OPRD1 的 基础 上 调 
整 。 假 设 由 OPRDI1 给 出 的 存储 单元 有 效 地 址 是 EA, 由 OPRD2 给 出 的 位 号 是 BitOffet 。 
在 OPRD1 是 32 位 存储 单元 的 情况 下 : 
实际 测试 的 存储 单元 有 效 地 址 = EA 十 (4 * (BitOffset DIV 32)) 
实际 测试 的 位 号 = BitOffset MOD 32 
在 OPRD1 是 16 位 存储 单元 的 情况 下 : 
实际 测试 的 存储 单元 有 效 地 址 = EA 十 (2 * (BitOffset DIV 16)) 
实际 测试 的 位 号 = BitOffset MOD 16 
另外 ,由 于 操作 数 OPRD2 可 以 是 有 符号 整数 值 ,因此 当 OPRD2 是 32 位 时 ,可 访问 
(一 2G) 至 (2G 一 1) 范 围 内 的 位 串 ; 当 OPRD2 为 16 位 时 ,可 访问 (一 32K) 至 (32K 一 1) 范 围 内 
的 位 串 。 
【 例 4-12】 改写 例 4-10 中 dp48 的 嵌入 汇编 代码 二 。 改 写 后 的 嵌入 汇编 代码 as49 如 下 
所 示 : 
/嵌入 汇编 代码 as 入 处 理 一 个 多 位 的 位 串 ) 
_asm{ 


LEA EX bitstr2 ;取得 位 串 2 的 基地 址 
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MV EX17 和 第 07 位 
BTS DWRD PTR [EDX], EX ;设置 第 人 7 位 
WW/ EX 4 第 如 位 
BIS DWORD PIR [EX], EX ;设置 第 名 位 


] 

与 dp48 的 嵌入 汇编 代码 二 相 比 ,最 后 两 条 指令 不 同 。 在 上 述 as49 中 ,利用 了 指令 BTS 
可 以 跨越 32 位 边界 的 特点 ,这 样 把 由 64 位 构成 的 位 串 作为 一 个 整体 来 对 待 。 

当然 ,也 可 以 把 这 64 位 的 位 串 作 为 4 个 16 位 的 位 串 来 处 理 。 实 现 相 同 功能 的 嵌入 汇编 
代码 as410 如 下 所 示 

1/ 嵌入 汇编 代码 as4ld 处 理 4 个 6 位 的 位 串 ) 


_asm{ 
LEA EX bitstr2 ;取得 位 串 2 的 基地 址 
Wy C 位 16 第 了 位 ,是 第 1 个 字 的 第 1 位 
BTS WD PTR [EX+2, CX ;设置 第 1 个 字 的 第 1 位 
WW CoX 4 第 8 位 ,是 第 2 个 字 的 第 人 位 
BS WORD PTR [EX+ 4], CX ;设置 第 2 个 字 的 第 1 位 


] 
注意 ,在 上 述 as410 中 ,位 串 操作 指令 的 存储 器 操作 数 是 字 单 元 ,所 以 采用 16 位 寄存 器 
CX 来 给 出 设置 的 位 。 
3. 位 扫描 指令 组 
位 扫描 指令 组 含有 两 条 指令 ; 顺 向 位 扫描 (Bit Scan Forward) 指 令 BSF 和 逆向 位 扫描 
(Bit Scan Reverse) 指 令 BSR。 
这 两 条 位 扫描 指令 的 格式 如 下 : 
BF Om OFD2 
BR OW, RP 
其 中 ,操作 数 OPRD1 是 16 位 或 32 位 通用 寄存 器 ,操作 数 OPRD2 可 以 是 16 位 或 32 位 
通用 寄存 器 或 者 存储 单元 ; 但 操作 数 OPRD1 和 OPRD2 的 位 数 (长 度 ) 必 须 相 同 。 
顺 向 位 扫描 指令 BSF 的 功能 是 从 右 向 左 ( 位 0 至 位 15 或 位 31) 扫 描 字 或 者 双 字 操作 数 
OPRD2 中 第 一 个 含 “1” 的 位 ,并 把 扫描 到 的 第 一 个 含 *1” 的 位 的 位 号 送 至 操作 数 OPRD1。 
逆向 位 扫描 指令 BSR 的 功能 是 从 左 向 右 ( 位 15 或 位 31 至 位 0) 扫 描 字 或 者 双 字 操作 数 
OPRD2 中 第 一 个 含 “1” 的 位 ,并 把 扫描 到 的 第 一 个 含 “1” 的 位 的 位 号 送 至 操作 数 OPRD1。 
如 果 字 或 双 字 操作 数 OPRD2 等 于 0, 那 么 零 标 志 ZF 被 置 1 ,操作 数 OPRD1 的 值 不 确定 ; 
否则 零 标 志 ZF 被 清 0。 
其 他 标志 CF、SF、OF、AF 和 PF 无 定义 。 
【 例 4-13】〗 如 下 指令 片段 演示 位 扫描 指令 的 使 用 ,分 号 后 的 注释 给 出 指令 执行 后 相关 寄 
存 器 和 零 标志 ZF 的 内 容 。 
MXV EX 12345678H 
BR EX EX 0 ENE 10H 
BF DA 0 M2 








BF C&D 0 Cc1 


4.2.2 应 用 举例 


下 面 结 合 点 阵 或 者 位 图 (bitmap) 的 处 理 , 来 演示 位 操作 指令 的 简单 应 用 。 

【 例 4-14】 编写 一 个 把 8X8 的 点 阵 顺 时 针 旋 转 90 的 子 程序 。 假 设 一 个 8X8 的 点 阵 由 
8 个 字 节 构成 ,每 一 个 字 节 对 应 一 行 ,如 图 4.2 所 示 。 

利用 位 串 操 作 指 令 实 现 点 阵 顺 时 针 旋 转 90 的 子 程序 as411 如 下 所 示 : 

// 子 程序 名 ( 入 口 标号 : RIGHT9O0 

/功能 : 把 8X8 点 阵 顺 时 针 旋 转 g 

/入 口 参数 : 堆栈 中 含有 原始 点 阵 和 目标 点 阵 区 域 的 首 地 址 

/说 “ 明 : 寄存 器 EX 和 EX 受到 影响 


asm{ 
RIGHT9O: 
PUSH EP 
WW Ep, EP ;建立 堆栈 框架 
PUSH ESI 
PUSH I ;保护 使 用 到 的 寄存 器 
pH EX 
MV ESI, [EEP+ 引 ;从 堆栈 中 取得 原始 点 阵 首 地 址 
MXV 印 !,， [EBP+ 何 ;从 堆栈 中 取得 目标 点 阵 首 地 址 
WW EX0 ;表示 目标 点 阵 的 当前 位 
WwW EX7 ;表示 原始 点 阵 的 列 
LAB1: 
WwW EX 0 ;表示 原始 点 阵 的 行 
LAB2: 
BR DW PTR [ED], EX : 先 清 目标 点 阵 的 当前 位 
BT DWFD PTR [ESI+ EDX], EX 测试 原始 点 阵 的 BX 行 的 以 列 
J UB ;如 为 0, 无 须 设 置 
BITS DW PTR [DU, EX ;设置 目标 点 阵 的 当前 位 
LAB3: 
im EX :依次 调整 目标 点 阵 当 前 位 


EX ;调整 原始 点 阵 行 
EX 8 根据 行 号 ,控制 循环 


EX ;调整 原始 点 阵列 
根据 列 号 ,控制 外 循环 


[| :恢复 被 保护 寄存 器 


人 
肌 
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PP EP ;撤销 堆栈 框架 
RET ;返回 
] 
假设 原始 点 阵 如 图 4. 2(a) 所 示 ,变换 后 所 得 的 目标 点 阵 如 图 4. 2(b) 所 示 。 由 于 是 顺 时 针 
旋转 90", 因 此 图 4. 2(a) 的 左上 角 成 为 图 4.2(b) 的 右上 角 , 图 4.2(a) 的 左下 角 成 为 图 4.2(b) 
的 左上 角 。 或 者 说 ,原始 点 阵 的 右 起 第 7 列 成 为 目标 点 阵 的 第 0 行 ,第 6 列 成 为 第 1 行 ,以 此 
类 推 。 


G 


(a) 原始 点 阵 (b) 目标 点 阵 
图 4.2 例 4-14 点 阵 变换 示意 图 


一 一 一 一 一 一 一 = 
oooco-o-oo 
ooo-oo-o 
ooo-ooo- 
ocoo-oo-0o 
ooo-o-oo 


0 
0 
0 
1 
1 
1 
1 
| 


oooooooo 
o-ooooo- 
o-ooooo- 
o-ooooo- 
coo-ooo-0o 
ooo-o-oo 
ooocoo-ooo 


i 时 
10 
10 
TI0 
1 0 
1 0 
对 | 
00 


从 as411 的 代码 可 知 , 采 用 二 重 循环 实施 点 阵 变换 。 在 变换 过 程 中 ,在 获取 原始 点 阵 的 位 
信息 时 ,利用 寄存 器 ECX 表示 列 ,EDX 表示 行 。 对 应 地 ,外 循环 由 列 控制 ,从 右 起 第 7 列 , 依 
次 递减 到 第 0 列 ; 内 循环 由 行 控制 ,每 次 从 第 0 行 开始 ,依次 递增 到 第 7 行 。 

在 变换 过 程 中 ,由 寄存 器 EBX 表示 目标 点 阵 的 当前 位 。 随 着 EBX 的 递增 ,目标 点 阵 的 当 
前 位 从 图 4. 2(b) 的 右上 角 ,逐步 到 左下 角 。 演 变 顺序 为 : 从 目标 点 阵 第 0 行 的 位 0, 依 次 到 第 
0 行 的 位 7, 然后 第 1 行 的 位 0, 依 次 到 位 7, 如 此 直到 左下 角 。 在 设置 目标 点 阵 的 位 时 ,充分 利 
用 了 指令 BTR 和 BTS 可 以 跨越 32 位 或 者 16 位 边界 的 特点 。 

如 下 程序 dp412 演示 调用 上 述 子 程序 as411。 首 先 显示 一 个 8X8 的 原始 点 阵 信 息 ; 然后 
调用 子 程序 ,把 原始 点 阵 顺 时 针 旋 转 90° 成 为 目标 点 阵 ; 最 后 显示 目标 点 阵 信 息 。 

#include < stdio.h> /演示 程序 dp413 处 理 88 点 阵 ) 

void pbm_8 unsigned char bitmep[ ] ) ; 

unsigned char bitmep_al 8 ={ 0x10 0028 0<44 082 QFE 082 082 X82} ; 

unsigned char bitmp _b[8] ; 


int mair() 
{ 
pbmp_8 bitmap a) ; /显示 原始 点 阵 
printf"\n" ) ; 
/调用 顺 时 针 旋转 9 子 程序 
_asn{ 
LEA EM bitmp b 
PUSH EX ; 压 人 目标 点 阵 首 地 址 
LEA EM bitmp a 
PUSH EX ; 压 人 原始 点 阵 首 地 址 
CAL RIGHTSO ;调用 子 程序 


AD ESP 8 ;平衡 堆栈 
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phrp_B8 bitmap b) ; // 显 示 目 标点 阵 
return 0; 
4 
/此 处 安排 子 程序 as411 代码 
六 
} 
/显示 8X 8 点 阵 信 息 ( 用 点 号 表示 0, 用 星 号 表示 1 
void pbm_8 unsigned char bitmep[ |] ) 
{ 
int i,j; 
unsigned int lineb; 
unsigned char ah; 


for i=0; i<8; it // 逐 行 
{ 
lineb= bitmep[ 站 ; 
for 上 7; j>=0; 广 - ) V/ 私 列 
dF'.'; /用 点 号 表示 0 
if linb & 1<< j) ) 
dF* /用 星 号 表示 1 
printf"%c”"”，ch) ; 
} 
printk" \n" ) ; 
% 


} 

【 例 4-15】 编写 一 个 程序 处 理 16X16 的 点 阵 , 以 行为 单位 ,每 行 仅 保留 可 能 有 的 最 右 和 
最 左 各 一 位 为 “1” 的 位 。 假 设 每 一 行 占用 连续 的 两 个 字 节 ,并 且 采 用 “高 高 低 低 ” 规 则 , 即 高 8 
位 占用 的 字 节 存储 在 高 地 址 单元 。 

/演示 程序 dh413 处 理 16X 6 点 阵 ) 

#include < stdio.h> 

void phrp_16X1& unsigned char bitmep[ ] ) ; 

/原始 16X 6 点 阵 信息 

unsigned char fonts[ 32]={ 0x00 000 Oxc0 003 Oxf0 0xOfF, Oxf8, Qf, 


Oxf8, Qx1f, 0xfc Ox3f, 0dc 03f Oxfe, Ox3f, 
OQxfc, 0x3F, Oxfc, 0x3f, Oxf8, Ox1f, Oxf8, 0x1f, 
Oxf0, OOF Oxc0, 0x08, 0x00, 000 000 000] ; 
unsigned char cycle[ 32]={0} ; /准备 存放 目标 点 阵 
int mair() 
{ 
pbmp_16(k fonts) ; // 显 示 原 始点 阵 
printR" \n" ) ; 
/使 得 每 一 行 仅 剩 可 能 存在 的 最 右 和 最 左 的 各 一 位 为 " 1" 的 位 
_asm{ 
LEA ESI, fonts -2 ;设置 原始 点 阵 区 域 首 地 址 ( 减 2) 
LEA EI, ocle-2 ;设置 目标 点 阵 区 域 首 地 址 ( 减 2) 


MW EX 16 :共计 16 行 
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NEXT: 
BSF A WORD PTR [ESI+ ECxkk 了 习 ;确定 原始 点 阵 行 最 右 侧 " 1" 位 
由” ONT ;如 果 整 行 没 有 "1" , 则 跳 转 
BTS WD PTR [EDI+ EX I, 以 ;设置 目标 点 阵 对 应 的 位 为 "1" 
AMX, WORD PTR [ESI+ ECxk 了 习 ;确定 原始 点 阵 行 最 左 侧 " 1" 位 
BTS WORD PIR [I+ EDtk 习 , MX ;设置 目标 点 阵 对 应 的 位 为 "1" 

OONT: 
LOOP NEXT 证 一 行 

} 

MA 

pbmp_1Gdk cycle) ; /显示 目标 点 阵 

retum 0; 


} 
/显示 输出 6X 6 点 阵 ( 位 值 0 或 1, 分 别 用 字符 " 0" 和 " 1" 表示 ) 
void ”pbm_1Gk unsigned char bitmep[ ] ) 
{ 
int i,j; 
unsigned int lineb; 
unsigned char ah; 
for i=0; i< 16 itHH /行为 单位 显示 
{ 
lineb=( bitmep[ i* 2+ 1 << 8) + bitmep[ i* 2] ; 
for 上 上 15; j>=0; i-- ) /显示 一 行 之 各 列 
{ 
dF( linb & 1<< j)) ?1:0; 
chr='0'; 
printf" %c" , oh) ; 
} 
printk" \n" ) ; 
} 
} 


上 述 程 序 dp413 演示 处 理 16X16 点 阵 。 首 先 显示 16X16 的 原始 点 阵 ; 然后 采用 嵌入 汇 
编 代 码 处 理 16X16 点 阵 ; 最 后 显示 目标 点 阵 。 

在 嵌入 汇编 代码 中 ,考虑 到 循环 计数 ,从 点 阵 最 底部 的 行 开 始 处 理 。 为 了 简化 表示 ,在 取 
得 点 阵 首 地 址 时 , 先 减 去 2。 

在 上 述 演示 程序 dp413 中 , 现 有 的 原始 点 阵 是 一 个 实心 圆 ,在 处 理 后 形成 一 个 有 ”缺陷 ?的 
空心 圆 。 


4.3 条 件 设置 字 节 指令 


虽然 程序 因 分 支 变 得 "丰富 多 彩 ”, 但 通常 减少 分 支 能 够 提高 执行 效率 。 实 际 上 ,如 果 把 执 
行 指令 看 作 是 流水 线 操作 处 理 ,那么 减少 对 流水 线 的 “冲刷 ”, 能 够 大 大 提高 效率 。 有 些 情况 
下 ,分支 仅 仅 只 是 为 了 设置 不 同 的 值 。IA-32 系列 CPU 提供 条 件 设置 字 节 指令 ,利用 这 些 指 
令 可 以 很 方便 地 按 条 件 设置 不 同 的 字 节 值 ,从 而 避免 分 支 。 
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4.3.1 条 件 设置 字 节 指令 概述 


1. 导 和 人 示例 
在 具体 介绍 条 件 设置 字 节 指令 之 前 , 先 来 看 一 个 示例 。 
【 例 4-16】 观察 如 下 C 函数 cf414 的 目标 代码 。 
int cfA4 int x, int y) 
《 
x & OOf; 
y & OxOf; 
retun (x>y?1:0); 
} 
该 函数 的 功能 是 , 按 二 进 制 数 形式 表示 的 最 后 4 位 判断 大 小 ,如 果 xz 大 于 yy, 则 返回 1, 否 
则 返回 0。 采 用 编译 优化 选项 “使 速度 最 大 化 ”, 编译 上 述 函 数 后 ,可 得 到 如 下 所 示 的 目标 
代码 。 





;函数 cf414 目 标 代码 

push ebp 

mov ebp, ep 

mv eax, DNORD PTR [ebpr 8] ;取得 参数 x 

mv ecx, DWRD PTR [ebpt 1 ;取得 参数 y 

and eax 15 ; and eax 0000000FH 
xor edx, edx 

ad ecx 15 ; and ecx，0000000FH 
ap al,cl ;比较 

setg dl ;如 果 al 大 于 cl, 则 使 d=1 
my eax ekk ;准备 返回 值 
pp ep 

ret 


从 上 述 目 标 代码 可 知 , 先 从 堆栈 中 取得 参数 z 和 yy 的 内 容 ,随即 分 别 截取 最 后 4 位 ,然后 
进行 比较 , 当 满 足 大 于 条 件 时 ,设置 寄存 器 dl 为 1。 利 用 条 件 设 置 字 节 指令 ,避免 了 分 支 。 

2. 条 件 设置 字 节 指令 

条 件 设 置 字 节 指令 的 一 般 格式 如 下 : 

SETcc OD 

其 中 ,符号 cc 是 代表 各 种 条 件 的 缩写 ,是 指令 助 记 符 的 一 部 分 ; 操作 数 OPRD 只 能 是 8 
位 寄存 器 或 者 字 节 存储 单元 ,用 于 存放 设置 结果 。 当 条 件 满足 时 ,将 目的 操作 数 OPRD 设置 
为 1, 否 则 设置 为 0。 

这 里 的 条 件 与 条 件 转 移 指令 中 的 条 件 几乎 是 一 样 的 。 

这 些 条 件 设置 字 节 指令 共有 16 条 ,如 表 4. 1 所 示 。 为 了 便于 记忆 和 使 用 ,有 些 指令 有 多 
个 助 记 符 ,这 与 条 件 转移 指令 类 似 。 

这 些 条 件 设置 字 节 指令 不 影响 标志 寄存 器 中 的 各 个 标志 。 

【 例 4-17】 如 下 指令 片段 演示 条 件 设置 字 节 指令 的 使 用 ,分 号 之 后 的 注释 说 明 在 执行 指 
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令 后 相关 寄存 器 的 值 ,其 中 HH 表示 十 六 进 制 。 


MV AL2H A= 23H 

MV D3 ;DL= 3H 

AD 人 LDL A=5H pn= 3 大 0 =0 
SETINZ DL A=58H DL= OoIH 

SET A A= OH DL= olIH 

SB 人 LDL A=FH DO=0H 大 0 OF=1 
SETC A A=0H DL= OH 


表 4.1 条 件 设置 字 节 指令 
























































指令 格式 功能 说 明 测试 条 件 
SETZ OPRD 
a OD 等 于 0 或 者 相等 时 , 置 OPRD 为 1 ZF=1 
SETNZ OPRD 
i OD 不 等 于 0 或 者 不 相等 时 , 置 OPRD 为 1 | ZF=0 
SETS OPRD 为 负 置 OPRD 为 1 SF=1 
SETNS OPRD 为 正 置 OPRD 为 1 SF=0 
SETO OPRD 溢出 置 OPRD 为 1 OF=1 
SETNO OPRD 不 溢出 置 OPRD 为 1 OF=0 
SETP OPRD 
i Pe 偶 置 OPRD 为 1 PF=1 
SETNP OPRD 
i OBRD 奇 置 OPRD 为 1 PF=0 
SETB OPRD 
pt Dee 低 于 、 不 高 于 等 于 或 者 进位 时 ， 全 
置 OPRD 为 1 
SETC OPRD 
SETNB OPRD 卫 
A Ne 不 低 于 、 高 于 等 于 或 者 无 进位 时 ， En 
置 OPRD 为 1 
SETNC OPRD 
SETBE OPRD 
SETNA OPRD 低 于 等 于 或 者 不 高 于 时 , 置 OPRD 为 1 | CF=1 或 者 ZF=1 
SETNBE OPRD 
SETA OPRD 不 低 于 等 于 或 者 高 于 时 , 置 OPRD 为 1 | CF=0 并 且 ZF=0 
SETL OPRD 
i OPE 小 于 或 者 不 大 于 等 于 时 , 置 OPRD 为 1 | SF 了 OF 
SETNL OPRD 
ei ea 不 小 于 或 者 大 于 等 于 时 , 置 OPRD 为 1 | SF=OF 
SETLE OPRD 
GPR 小 于 等 于 或 者 不 大 于 时 , 置 OPRD 为 1 | ZF=1 或 者 SF 了 OF 
SETNLE OPRD 
Se RD 不 小 于 等 于 或 者 大 于 时 , 置 OPRD 为 1 | ZF=0 并 且 SF=OF 


【 例 4-18】 如 下 代码 片段 检测 寄存 器 EAX 中 的 8 位 十 六 进 制 数 是 否 有 一 位 为 0, 检测 结 
果 由 寄存 器 BH 反映 。 





MV Bo 
W EX 8 

NEXT: 
TEST AL OH 浏 断 外 低 4 位 是 否 为 0 
SEZ BL ;是 , 则 使 得 B=1 
RR BE ;保存 检测 结果 
RR EAX 4 
LOP NET 


【 例 4-19】〗 如 下 程序 dp415 的 功能 是 统计 字 节 数据 缓冲 区 中 正 数 和 负数 的 个 数 。 假 设 ， 
缓冲 区 长 度 不 超过 256, 且 数据 为 0 表示 缓冲 区 结尾 。 其 中 ,嵌入 汇编 代码 演示 条 件 设置 字 节 
指令 的 使 用 。 

#include < stdio.h> 

char buffer[ ]={ 3 -5 286-8-970: 

int mair() 


_asm{ 
XR EX EX ;计数 器 清 0 
LEA ESI, buffer :ESI 指向 缓冲 区 首 
NEXT: 
LODSB ; 取 字 节 数 据 
QP AL0 ;比较 ,会 影响 各 状态 标志 
由 SHORT OR ;如 果 结 束 , 则 跳 转 
SETG OL 正 数 时 po 1, 和 否则 D=0 
SL DH ;负数 时 吓 1, 否 则 上 f0 
AD QD ;统计 正 数 
AD QDH ;统计 负数 
JP NET ;继续 
FR: 
XR EM EX 准备 保存 统计 结果 
WW AL CL 
MO pcont, EX ;保存 正 数 的 个 数 
WW AL OH 
MN mont, EX ;保存 负数 的 个 数 


} 
printf ”pcount= % dmcount=% 路 n”，pcount， mcount) ; 
retum 0; 

} 


从 上 述 嵌 入 汇编 代码 可 知 , 利 用 条 件 设置 字 节 指令 ,在 统计 正 数 和 负数 时 ,避免 了 条 件 转 
4.3.2 应 用 举例 
在 一 些 场合 中 ,可 以 利用 条 件 设置 字 节 指令 SETcc 代 蔡 条 件 转移 指令 Jcc。 
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【 例 4-20】 推广 例 4-16 到 其 他 应 用 场合 。 
假设 需要 计算 如 下 的 类 C 条 件 表达 式 , 其 中 r1、r2 和 r3 分 别 表示 通用 寄存 器 ,ae 表示 寄 
存 器 rl 的 值 高 于 等 于 (above or equal) 寄 存 器 r2 的 值 : 
r3(rlaer) ?1:0; 
如 下 类 汇编 代码 片段 as416a 采用 条 件 转 移 指令 实现 功能 : 
OP rl,r2 
MY r31 
Je NET 
MW r30 
NEXT: 
如 下 类 汇编 代码 片段 as416b 采用 条 件 设置 字 节 指令 实现 功能 : 
XR no 


上 述 代 码 片 段 as416b 的 执行 效率 要 高 于 代码 片段 as416a。 所 以 ,通常 情况 下 应 该 使 用 
as416b 片段 代替 as416a 片段 。 

当然 ,表示 “高 于 等 于 ”的 条 件 “ae”, 也 可 以 根据 需要 修改 为 其 他 条 件 。 

【 例 4-21】 推广 例 4-16 到 更 普遍 的 应 用 场合 。 

假设 需要 计算 如 下 的 类 C 条 件 表 达 式 ,其 中 r1、r2 和 r3 分 别 表示 通用 寄存 器 ,cc 表示 条 
件 ,CONST1 和 CONST2 分 别 表示 常数 : 

r$( ri oc r2) ?ONST1 : OONST2 ; 
如 下 类 汇编 代码 片段 as417a 采用 条 件 转 移 指令 实现 : 


OP rl,r2 
MV  r3 ONSTI 
Joc NBT 
MV  r3 ONST2 
NEXT: 
如 下 类 汇编 代码 片段 as417b 采用 条 件 设置 字 节 指令 实现 : 
XR r3r3 
OP rl,r2 
SETcc ra ;r3L 表 示 r3 低 8 位 寄存 器 
DEC r3 
AD  r3 ONST2- ONST1 
AD  r3 OONSTI ;如 OONST1 为 0 可 省 


上 述 汇编 代码 片段 as417a 含有 条 件 转移 指令 ,汇编 代码 片段 as417b 避免 了 条 件 转 移 指 
令 。 当 然 ,是 否 要 用 代码 片段 as417b 代替 代码 片段 as417a, 还 取决 于 对 时 间 和 空间 等 的 综合 
考虑 。 

【 例 4-22】 利用 条 件 设置 字 节 指令 ,编写 一 个 把 4 位 二 进 制 数 转换 为 对 应 的 十 六 进 制 数 
符 ASCII 码 的 子 程序 。 

如 下 子 程序 as418 实现 所 需 功 能 : 


2 
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/ 拖 程 序 名 ( 入 口 标 易 : TOAScN 

/功能 : 把 4 位 二 进 制 数 转换 为 对 应 十 六 进 制 数 符 的 ASCI 码 
A/ 入口 参数 : 如 低 4 位 =4 位 二 进 制 数 

/出 口 参数 : ME 十 六 进 制 数字 符 ASCN 码 


_asmf 


8 


机 泊 当中 多 
产 严 严 严 产 产 产 


疙 低 4 位 = 十 六 进 制 数 


ss 于 


民 局 


习 题 


1. 字符 串 操 作 中 字符 的 尺寸 有 哪些 ? 为 什么 支持 多 种 不 同 尺寸 的 字符 ? 

2. 请 说 明 标 志 寄存 器 中 标志 DF 的 作用 。 如 何 设置 标志 DF? 

3. 在 IA-32 系列 CPU 的 指令 集中 ,哪些 指令 属于 两 个 操作 数 都 可 以 是 存储 器 操作 数 这 
种 例外 情况 ? 

4. 请 说 明 指令 LODSD 与 如 下 程序 片段 的 异同 : 


MV EMX, [ESD 
AD Esl,4 


5. 请 说 明 指令 STSOW 与 如 下 程序 片段 的 异同 : 


MV [BA 从 
AD El,2 


6. 请 说 明 指令 SCASB 与 如 下 程序 片段 的 异同 : 


QP 人 AL [ES:BH 
INC ol 


7. 请 写 一 个 程序 片段 代替 指令 “REP MOVSW”。 
8. 请 写 一 个 程序 片段 代替 指令 “REPNZ CMPSB”。 
9. 请 简要 说 明 位 操作 指令 的 特点 。 


10. 


Li 
12. 
13. 
14. 


请 比较 如 下 两 个 指令 片段 的 异同 : 
AD A 以 OF W 5 
BR MC 


请 编写 一 个 程序 片段 代替 指令 “BSR EDX, EAX”。 

假设 AL 中 含有 一 个 有 符号 数 , 请 给 出 判断 其 所 含 是 正 数 的 多 种 方法 ? 
假设 BL 中 含有 一 个 无 符号 数 . 请 给 出 判断 其 是 4 的 倍数 的 多 种 方法 ? 
在 指令 集中 引入 条 件 设置 字 节 指令 的 主要 原因 是 什么 7 并 举例 说 明 。 
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15. 条 件 设置 字 节 指令 中 的 条 件 与 条 件 转 移 指令 中 的 条 件 , 是 否 相 同 ? 为 什么 ? 

16. 请 编写 一 个 程序 片段 ,不 利用 条 件 转移 指令 ,实现 如 下 功能 : 当 EAX 不 等 于 EBX 
时 ,使 得 EDX 为 2, 和 否则 EDX 为 3。 

17. 如 下 程序 由 用 户 输入 一 个 字符 串 ; 统计 字符 串 中 元 音字 母 的 个 数 ; 显示 输出 统计 结 
果 。 除 了 框架 外 ,采用 能 入 汇编 代码 的 形式 。 请 在 每 个 横 线 上 填写 一 条 汇编 格式 指令 ,使 得 程 

#include < stdioh> 


int mair() 
{ int oot; 
char buffer[128] ; 
printk" 请 输入 一 个 字符 串 :" ) ; scanf" %s" ,buffer) ; 
asm{ 
aD 
LEA ESI, buffer 
XR EX EX 
SB EX ER 
时 
mR 人 AL 
工 L2 
COAL lSaeiou 浏 断 是 否 元 音字 母 
AD EX EX 
JP UL 
DD: WY ont, EX 


printk" 该 字符 串 中 含 元 音字 母 数 =%d\n" ,count) ; 


:大 小 写 一 致 化 


下 列 编程 题 ,除了 输入 和 输出 操作 之 外 ,请 采用 嵌入 汇编 的 形式 实现 。 

18. 由 用 户 从 键盘 输入 两 个 字符 串 ; 然后 把 两 个 字符 串 合并 到 一 起 ; 最 后 显示 输出 合并 
后 的 字符 串 。 

19. 由 用 户 从 键盘 输入 一 个 字符 串 ; 过 滤 掉 其 中 可 能 出 现 的 标点 符号 ; 显示 输出 过 滤 后 
的 字符 串 。 设 计 子 程序 判断 字符 是 否 是 标点 符号 ,并 充分 利用 字符 串 操 作 指 令 。 

20. 由 用 户 从 键盘 输入 两 个 字符 串 strl 和 str2; 在 strl 中 查找 确定 首 个 同时 出 现在 str2 
中 字符 的 位 置 (如 果 未 出 现 , 则 设 位 置 为 一 1); 显示 输出 位 置 值 。 

21. 由 用 户 从 键盘 输入 两 个 字符 串 strl 和 str2; 查找 确定 str2 在 strl 中 出 现 的 起 始 位 置 
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(如 果 未 出 现 , 则 设 起 始 位 置 为 一 1); 显示 输出 起 始 位 置 值 。 

22. 由 用 户 从 键盘 分 别 输入 一 个 字符 ch 和 一 个 数值 x; 生成 一 个 由 字符 ch 构成 的 个 
字符 的 字符 串 ; 显示 输出 该 字符 串 。 设 计 子 程序 实现 生成 由 指定 字符 构成 的 字符 串 ,并 充分 
利用 字符 串 操作 指令 等 。 

23. 由 用 户 从 键盘 输入 一 个 字符 串 ; 统计 字符 串 的 长 度 ; 采用 十 六 进 制 数 的 形式 显示 输 
出 统计 结果 。 设 计 子 程序 ,利用 重复 字符 串 扫 描 操 作 指令 ,统计 字符 串 的 长 度 。 设 计 子 程序 ， 
把 整数 转换 成 对 应 的 十 六 进 制 数 字符 串 。 设 计 子 程序 ,利用 条 件 设置 字 节 指令 ,把 一 位 十 六 进 
制 数 转换 成 对 应 字符 ASCII 码 。 

24. 由 用 户 从 键盘 分 别 输入 两 个 十 六 进 制 数值 ; 然后 求 它们 的 和 与 差 ; 最 后 采用 十 六 进 
制 数 的 形式 分 别 输出 结果 。 假 设 只 能 采用 字符 串 格式 实现 输入 和 输出 ,并 且 应 充分 利用 字符 
串 操 作 指 令 。 设 计 子 程序 ,把 一 个 由 十 六 进 制 数字 符 构 成 的 字符 串 转 换 成 对 应 的 数值 ,注意 字 
符 串 可 能 有 前 导 空格 等 。 设 计 子 程序 ,判断 一 个 字符 是 否 是 十 六 进 制 数 的 字符 。 

25. 由 用 户 输入 4 个 整数 ,构成 一 个 128 位 的 数据 ; 利用 位 操作 指令 ,统计 其 中 位 值 为 1 
的 个 数 ; 显示 输出 统计 结果 。 

26. 由 用 户 输入 一 个 字符 串 ( 假 设 非 空 ) ,将 其 值 视 为 一 个 位 串 ; 利用 位 操作 指令 ,统计 位 
串 连续 为 0 的 最 大 长 度 。 例 如 ,输入 字符 串 "1BA”, 则 位 串 连续 为 0 的 最 大 长 度 是 5。 

27. 由 用 户 输入 一 个 字符 串 ,统计 其 中 标点 符号 的 个 数 ,显示 输出 统计 结果 。 注 意 充分 利 
用 字符 串 操 作 指令 和 条 件 设置 字 节 指令 。 

28. 由 用 户 输入 一 个 字符 串 ( 假 设 非 空 ) ,将 其 视 为 由 若干 个 单字 节 数 据 构 成 的 数组 ;分 
别 统计 正 数 和 偶数 的 个 数 ; 显示 输出 统计 结果 。 注 意 利用 条 件 设置 字 节 指令 等 。 





雍 
on 
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VC 目标 代码 的 阅读 理解 


阅读 理解 高 级 语言 源 程序 的 目标 代码 ,不仅 有 助 于 学 习 汇编 语言 程序 设计 ,而 且 有 助 于 提 
升 高 级 语言 程序 设计 能 力 。 在 介绍 VC 编译 器 生成 的 目标 代码 文件 样式 的 基础 上 ,本 章 解析 
C 和 C++ 部 分 语言 功能 的 实现 细节 ,介绍 目标 代码 优化 的 相关 概念 和 方法 ,讨论 几 个 典型 库 函 
数 的 汇编 源 代码 。 





5.1 汇编 语言 形式 的 目标 代码 


在 微软 Visual Studio 2010 的 VC 集成 开发 环境 中 ,可 以 由 C 或 者 C++ 源 程序 生成 汇编 语 
言 形式 的 目标 代码 。 本 节 简 要 介绍 这 样 的 目标 代码 文件 的 样式 。 


5.1.1 基本 样式 


首先 介绍 项 目 属性 页 中 的 配置 属性 的 相关 选项 值 及 其 使 用 。 

为 了 便于 对 比 源 程序 和 目标 程序 ,尽量 减少 由 编译 器 额外 增加 的 指令 ,所 以 在 项 目 属性 页 
中 的 配置 属性 中 采用 如 下 设置 。 

(1) 在 C/C++ 项 下 ,常规 的 调试 信息 格式 子 项 ,选择 “C7 兼容 (/27)”。 

(2) 在 C/C++ 项 下 ,代码 生成 的 基本 运行 时 检查 子 项 ,选择 “默认 值 ”, 既 不 进行 堆栈 帧 的 
检查 ,也 不 进行 未 初始 化 变量 的 检查 。 

(3) 在 C/C++ 项 下 ,代码 生成 的 缓冲 区 安全 检查 子 项 ,选择 “和 否 (/GS 一 )”。 

为 了 更 清楚 地 观察 对 库 函 数 的 调用 ,在 项 目 属 性 页 中 的 配置 属性 中 ,在 开始 的 常规 项 下 ， 
项 目 默认 值 的 MFC 的 使 用 子 项 ,选择 “在 静态 库 中 使 用 MFC”。 

在 本 章 下 面 的 介绍 中 ,如 果 无 特别 说 明 ,都 采用 如 上 所 述 的 项 目 属性 配置 。 实 际 上 ,在 前 
面 几 章 中 所 介绍 的 C 语言 程序 目标 代码 ,几乎 都 是 在 上 述 项 目 属性 的 配置 下 生成 的 。 

在 项 目 属性 页 的 配置 属性 中 ,在 C/C++ 项 下 ,输出 文件 的 汇编 程序 输出 子 项 ,如 果 选 择 
“ 仅 有 程序 集 的 列表 (/FA)”, 那 么 在 编译 时 将 生成 扩展 名 为 . asm 的 汇编 语言 形式 的 目标 代码 
文件 ; 如 果 选 择 “ 带 源 代码 的 程序 集 (/FAs)”, 那 么 在 生成 的 汇编 形式 的 目标 代码 中 ,还 含有 
作为 注释 的 高 级 语言 源 代码 。 

在 项 目 属性 页 的 配置 属性 中 ,在 C/C++ 项 下 ,优化 的 优化 子 项 是 主要 的 编译 优化 选项 。 
如 果 选 择 “ 已 禁用 (/Od)”, 表 示 不 希望 任何 优化 。 如 果 选 择 “ 使 大 小 最 小 化 (/O1)”, 表 示 和 希望 
目标 代码 的 长 度 尽量 短小 。 如 果 选 择 “ 使 速度 最 大 化 (/O2)”, 表 示 和 希望 目标 代码 的 执行 速度 
尽量 快 。 

【 例 5-1】 如 下 C 语言 程序 dp51 是 大 家 熟悉 的 一 个 经 典 程序 。 

#include < stdio.h> 





int mair() 

{ 
printk" Hello, world\n™ ) ; 
retum 0; 

} 


为 了 便于 对 比 源 程序 和 目标 代码 ,不 采用 编译 优化 选项 ,编译 上 述 源 程序 后 ,可 得 到 如 下 
所 示 的 目标 代码 文件 : 
程序 do61 的 目标 代码 ( 带 有 源 代码 的 程序 集 ; 已 禁用 优化 ) 
;Listing generated by Microsoft( R Optimizing Conpi ler Version 16 00 30819.01 
TITLE E:\ VCASM\ 0H5 仆 DP51.cpp ;标题 


.BP :指定 指令 集 

.XM :指定 指令 集 

include listing inc :包含 文件 listing inc 

.mode| flat ;采用 平坦 模式 
INOUpa_IB LIBOMTD ;包含 导入 库 文 件 LIBWTD 
INCLUDBLIB OLDNAWES ;包含 导入 库 文 件 QLDNANES 
asr SENMENT ; 段 OONST 的 开始 
$ SG3851 DB 'Hello world', QaH QH ;名称 为 $ S89851 的 字符 串 
OONST ENDS : 段 ONNST 的 结束 
RLIC _main 声明 公用 标号 _main 
EXIRN _ printf:PROC :声明 外 部 过 程 _ printf 


;Function ompi le flags: Odtp 
‘File e:\ vcasr\ ch5_N\ dp51.opp 


_TET SEGMENT : 段 _TBG 的 开始 
_main PROC ;过 程 _main 的 开始 
3 1 
push ebp 
mov ebp, ep ;建立 堆栈 框架 
二 printf" Hello world\n" ) ; 
push OFFSET $ S63851 闻 符 串 $ S63851 的 偏 移 作 为 参数 
call _ printf ;调用 库 函 数 printf 
add esp, 4 :平衡 堆栈 
5 和- retum 0; 
xor eax, eax ;返回 值 0 
汉 :} 
pop ep ;撤销 堆栈 框架 
ret 0 ;函数 返回 ( 同 ret, 不 额外 平衡 堆栈 ) 
_main EP ;过 程 _main 的 结束 
ET ENDS ;: 段 _TEG 的 结束 


BD ;程序 的 结束 
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除了 添加 的 中 文 注 释 外 ,上 述 程序 几乎 就 是 由 VC 2010 编译 器 输出 的 带 有 源 代码 的 汇编 
格式 程序 文件 全 貌 。 其 主体 是 对 应 C 源 程序 的 汇编 格式 指令 ,同时 包含 多 条 汇编 指示 (指令 ) 
和 伪 指令 。 因 此 , 称 之 为 汇编 语言 形式 的 目标 代码 。 

下 面 结 合 上 述 目标 代码 文件 ,简要 介绍 微软 宏 汇编 语言 的 汇编 器 MASM 的 相关 汇编 指 
示 ( 指 令 ) 和 伪 指 令 。 

汇编 指示 “. 686P” 用 于 指定 处 理 器 的 型 号 ,或 者 指定 适用 的 指令 集 。 随 着 IA-32 系列 
CPU 升级 换代 ,逐步 增加 了 一 些 指令 ,扩充 了 指令 集 。“. 686P” 表 示 Pentium Pro 及 以 上 档次 
的 处 理 器 , 即 这 类 处 理 器 的 指令 集 。 

汇编 指示 include 表示 包含 指定 的 文件 。 其 作用 类 似 C 语言 中 的 #include。 这 里 的 
include listing. inc 表示 包含 文件 listing. inc。 还 有 INCLUDELIB, 也 起 类 似 的 作用 ,用 于 表 
示 包 含 导 入 库 文件 。 

汇编 指示 “. model flat” 表 示 采 用 “平坦 ”存储 管理 模式 。 在 这 种 存储 管理 模式 下 ,虽然 
存储 器 分 段 管 理 , 但 各 个 存储 段 完全 重 释 , 都 是 4GB 的 线性 地 址 空间 。 也 就 是 说 ,只 需要 地 址 
偏 移 就 可 以 完全 确定 存储 单元 。 

PUBLIC 和 EXTRN 分 别 用 于 声明 标号 的 使 用 范围 和 来 源 。 

SEGMENT 和 ENDS 是 一 对 汇编 指示 ,用 于 表示 一 个 段 定义 的 开始 和 结束 。 这 里 的 
_TEXT SEGMENT 和 _TEXT ENDS 表示 段 _TEXT 的 开始 和 结束 ,其 中 ,TEXT 是 段 
名 。 通 常情 况 下 ,多 个 同名 同类 型 的 段 ,会 被 依次 合并 到 一 起 。 

PROC 和 ENDP 是 一 对 汇编 指示 ,用 于 表示 一 个 过 程 (函数 ) 定 义 的 开始 和 结束 。 这 里 的 
_main PROC 和 _main ENDP 表示 过 程 _main 的 开始 和 结束 ,其 中 ，main 是 过 程 名 ,也 代 
表 过 程 的 入口 地 址 。_main 过 程 是 main 函数 的 具体 实现 。 

在 数据 段 CONST 中 ,有 一 条 伪 指令 DB, 它 定义 了 若干 字 节 数据 ,构成 了 一 个 字符 串 。 

最 后 的 END 也 是 汇编 指示 ,表示 程序 到 此 为 止 。 

综 上 所 述 , 源 程序 dp51 的 目标 程序 有 一 个 数据 段 CONST 和 一 个 代码 段 _TEXT, 在 数据 
段 中 利用 伪 指 令 定义 了 一 个 字符 串 ,在 代码 段 中 定义 了 一 个 _main 过 程 。 


5.1.2 符号 化 表示 


在 VC 2010 环境 中 ,一 个 项 目 可 以 含有 多 个 源 程序 文件 。 根 据 编译 选项 ,在 编译 过 程 中 ， 
将 为 项 目 中 的 每 一 个 源 程序 文件 生成 对 应 的 汇编 诸 言 形式 的 目标 代码 文件 。 

为 了 简化 表述 ,在 本 章 后 面 的 示例 中 ,不 再 重复 列 出 目标 代码 文件 开始 部 分 的 相同 内 容 ， 
仅 列 出 对 应 的 代码 段 和 数据 段 ,或 者 仅 列 出 对 应 的 过 程 定义 。 

【 例 5-2〗 如 下 C 语言 函数 cf52 的 功能 是 返回 两 个 整数 之 差 的 绝对 值 ,观察 其 目标 代码 。 


int cf52 int parx, int pary) 
{ 


int varz; //( 整 型 局 部 变量 
Varz= parx- pary; // 得 到 绝对 值 
if varz < 0) 

var — varz; 
return varz; 


] 
为 了 便于 对 比 源 程序 和 目标 代码 ,不 采用 编译 优化 选项 ,编译 上 述 源 程 序 后 ,可 得 到 如 下 
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所 示 的 目标 代码 段 : 
;函数 cf@ 的 目标 代码 段 ( 带 有 源 代码 的 程序 集 ;已 禁用 优化 ) 
_TET SEQENT 赣 _TBXT 的 开始 
_varz$ =-4 ;size=4 ;符号 _varzh 的 声明 
_parx$ =8 ; size=4 ;符号 _ parx$ 的 声明 
_pary$ = 人 ;size=4 ;符号 _ pary$ 的 声明 
3of520 0 YANHazZ PROC ;过 程 ( 函数 ) cf@ 的 开始 
2 t 
push ep 
mov ebp, esp ;建立 堆栈 框架 
push ecx ;安排 变量 varz 的 存储 单元 
< | int varz; 
4 Varz= parx- pary: 
mov eax, DWORD PIR_ parx$ [ebp] 
sb eax, DIOFD PIR_ pary$ [ebp] 
mv DWORD PIR _varz$ [ebp], eax 
洛 : if varz < 0) 
jns SHORT $ LNI@ cf52 ;如 果 varz 不 小 于 0, 则 跳 转 
6 Varz= ~ varz; 
mov ecx, DWORD PIR_varz$ [ebp] 
ng ecx 
mv DMORD PTR _varz$ [ebp], ecx 
$ LNI@ cf52 
ss return varz; 
mov eax, DWORD PIR_varz$ [ebp] 
;8 : } 
mov esp, ep ;撤销 堆栈 框架 
pp ep 
ret 0 ;返回 ( 就 是 ret) 
3cf52a 6 YAHHH Z EP ;过 程 ( 函数 ) cf 吕 的 结束 
_TEXT BEDS : 段 _TEKG 的 结束 


除了 添加 的 中 文 注释 外 ,上 述 程序 片段 几乎 就 是 由 Visual Studio 2010 编译 器 输出 的 汇编 
格式 程序 文件 中 的 代码 段 。 其 主体 是 对 应 C 函数 的 汇编 格式 指令 , 含 于 过 程 定义 汇编 指示 
PROC 和 ENDP 之 间 , 又 含 于 段 定 义 汇编 指示 SEGMENT 和 ENDS 之 间 。 

从 上 述 程序 片段 可 知 ,过 程 名 ? cf52@Q@YAHHH@Z., 虽 然 含 有 源 程序 中 的 函数 名 cf52， 
但 比较 长 而 且 不 太 容 易 理 解 。 这 是 根据 函数 的 类 型 和 参数 个 数 等 由 编译 器 自动 生成 的 ,主要 
供 相 关 工 具 软 件 识 别 使 用 。 

还 有 标号 $LN1@cf52, 也 是 由 编译 器 自动 生成 的 。 

上 述 C 函数 cf52 有 两 个 整 型 参数 parx 和 pary, 还 有 一 个 局 部 变量 varz, 它 们 对 应 的 存储 
单元 都 位 于 堆栈 中 。 在 利用 指令 “PUSH ECX” 安 排 好 局 部 变量 varz 之 后 ,位 于 堆栈 的 相关 
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存储 单元 如 图 5. 1 所 示 ,也 类 似 于 图 3. 3(c) 。 
堆栈 底部 









上 -一 EBP+12 
参数 parx ”| 一 EBP+8 

返回 地 址 偏 移 [= 一 EBP+4 

-一 EBP 

上 -一 EBP-4 





5.1 例 5-2 位 于 堆栈 的 参数 和 局 部 变量 示意 图 


为 了 便于 阅读 理解 ,目标 代码 还 采用 符号 化 常量 ,形象 地 表示 函数 参数 和 局 部 变量 。 
为 此 ,首先 利用 如 下 MASM 伪 指 令 语句 ,使 得 3 个 符号 (标识 符 ) 分 别 代 表 常 数 : 
_varz$ =-4 
_parx$ =8 
_pary$ = 人 2 
这 3 个 标识 符 很 有 规律 ,以 源 程序 中 参数 名 或 变量 名 为 基础 ,通过 增加 下 面 线 前 级 和 美元 
号 后 级 而 形成 。 对 照 图 5. 1 可 见 , 这 些 符 号 所 代表 的 常数 ,其 实 就 是 堆栈 中 对 应 参数 或 者 变量 
所 在 存储 单元 以 EBP 作为 基准 的 相对 位 置 。 
然后 ,利用 这 样 的 符号 (标识 符 ) ,表示 存储 单元 的 有 效 地 址 ,如 下 所 示 : 
mov eax DWORD PTR_ parx$ [ebp] 
sub eax DNOFD PIR_ pary$ [ebp] 
mov DWORD PIR_varz$ [ebp], eax 
上 述 3 条 指令 ,分别 对 应 下 面 的 3 条 指令 : 
mov eax, DWORD PTR [ebp+t 8] 
sub -eax, DWRD PTR [ebp+ 12] 
因此 可 以 换 句 话说 :“_parx$ [ebp]” 表 示 位 于 堆栈 的 参数 parx,“_pary $ [ebpj” 表 示 位 
于 堆栈 的 参数 pary。 同 样 ,“_varz$ [ebp]” 表 示 位 于 堆栈 的 变量 varz。 
很 显然 ,在 采用 符号 化 表示 后 ,更 容易 阅读 理解 目标 代码 。 
【 例 5-3】〗】 观察 如 下 C 请 言 函 数 cf53 的 目标 代码 。 
unsigned cf53 unsigned int parx) 
{ 


unsigned char chl, d2.; /字符 型 局 部 变量 
unsigned sum; // 整 型 局 部 变量 

hl= parx > 24; // 得 到 参数 的 最 高 8 位 
HE parx & Oxff; // 得 到 参数 的 最 低 8 位 


sunF cht+t ch2; 





上 述 函 数 cf53 仅 是 一 个 示例 函数 ,其 功能 是 返回 参数 parx 最 高 8 位 和 最 低 8 位 之 和 。 


采用 编译 优化 选项 ,编译 上 述 源 程序 后 ,可 得 到 如 下 所 示 的 目标 代码 段 : 
;函数 cf53 的 目标 代码 段 ( 带 有 源 代码 的 程序 集 ; 已 禁用 优化 ) 


_TET SENENT : 段 _TEG 的 开始 
_d2 =-6 ; size= 1 ;符号 ch 的 声明 
_dhi$=-5 ; size=1 ;符号 _chf$ 的 声明 
_surb =-4 ; size=4 ;符号 _sun 的 声明 
_ parx$ =8 ; size=4 ;符号 _ parx$ 的 声明 
2cf530@YAll@Z PRC ;过 程 ( 函数 ) cf53 的 开始 
让 
push ep 
ebp，esp ;建立 堆栈 框架 
esp, 8 在 栈 项 保留 8 字 节 存储 单元 Ma 
unsigned char chl, dh?2; 
unsigned sum: 
cht= parx > 24 
eax, DWORD PTR _ parx$ [ebp] 
eax, 2 ;00000018H 
BYTE PIR _chi$ [ebp], al 
ch2= parx & Oxdff 
ecx, DIORD PTR _ parx$ [ebp] 
ecx, 25 ;000000ffH 
BYTE PIR _ch2$ [ebp], cl 
SuF chtt ch2; 


edx BYTE PIR _chi$ [ebp] 
eax BYTE PIR _ch2$ [ebp] 


让 


esp, ep 

ebp 

0 ;返回 ( 就 是 ret) 
3cf530@ YAlloZ BDP ;过 程 ( 函数 ) cf53 的 结束 
_TET BEDS : 段 _TE 的 结束 


上 述 C 函数 cf53 有 一 个 无 符号 整 型 参数 ,还 有 两 个 字符 型 局 部 变量 和 一 个 整 型 局 部 变 
量 , 它 们 对 应 的 存储 单元 都 位 于 堆栈 中 。 在 注释 带 //@ 的 行 ,利用 指令 “SUB ESP, 8? 在 栈 
项 保留 了 8 个 字 节 的 存储 单元 ,实际 上 就 是 安排 字符 型 局 部 变量 chl 和 ch2, 还 有 整 型 局 部 变 


量 sum 的 存储 空间 。 位 于 堆栈 的 相关 存储 单元 如 图 5.2 所 示 。 


从 上 述 目标 代码 可 知 ,利用 下 面 的 MASM 伪 指 令 语句 ,声明 多 个 符号 常数 : 


_ch2$ =-6 
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堆栈 底部 


NNN 


参数 parx 5 一 EBP+8 
返回 地 址 偏 移 Fe 一 EBP+4 


EBP | 一 EBP 





变量 sum ”| 一 EBP-4 


三 hl le EBP-5 
变量 ch2 ”|= 一 EBP-6 











图 5.2 例 5-3 位 于 堆栈 的 参数 和 局 部 变量 示意 图 
_chi$=-5 
_sunb =—4 
_ parx$ =8 
对 照 图 5.2 可 知 ,这 些 符号 常数 就 是 对 应 参数 或 者 变量 所 在 存储 单元 以 EBP 作为 基准 的 
相对 位 置 。 利 用 这 些 符号 常数 ,在 表示 参数 和 局 部 变量 的 存储 单元 有 效 地 址 后 ,使 得 目标 程序 
更 易于 阅读 理解 了 。 
结合 源 代码 ,应 该 很 容易 阅读 理解 上 述 汇编 形式 的 目标 代码 。 
在 前 面 几 章 中 ,介绍 或 说 明 目 标 代码 时 ,并 没有 采用 符号 化 表示 参数 和 变量 ,本 章 后 面 的 
示例 中 ,将 采用 符号 化 表示 。 另 外 ,对 标号 和 名 称 等 标识 符 也 将 会 适当 修饰 ,以 便 阅读 理解 。 


5.2 C 语 言 部 分 编译 的 解析 


从 汇编 语言 的 角度 ,可 以 清楚 地 看 到 函数 调用 的 详情 ,可 以 透彻 地 明白 指针 运用 的 本 质 。 
本 节 解 析 类 型 转换 、 表 达 式 求 值 .两 数 调 用 、 指 针 运 用 和 结构 体 变量 的 编译 细节 ,一 方面 巩固 熟 
练 CPU 的 指令 , 男 一 方面 深入 理解 高 级 语言 。 


5.2.1 类 型 的 转换 


在 C 诸 言 中 ,有 自动 类 型 转换 和 强制 类 型 转换 两 种 情形 。 在 计算 算术 表达 式 时 ,要 求 操 
作 数 的 数据 类 型 一 致 ,如 果 不 一 致 , 低 精 度 操作 数 被 自动 转换 为 高 精度 操作 数 。 在 计算 整 型 算 
术 表 达 式 时 ,至 少 采用 整 型 类 型 的 精度 ,如 果 表 达 式 中 有 字符 型 或 短 整 型 操作 数 ,那么 在 使 用 
之 前 被 自动 转换 为 整 型 类 型 。 还 可 以 根据 需要 ,采用 强制 类 型 转换 的 方式 ,明确 要 求实 施 类 型 
转换 。 

下 面 通过 分 析 目 标 代码 来 观察 C 语言 中 类 型 转换 的 实现 细节 。 在 VC 2010 环境 中 , 整 型 
为 32 位 ,采用 4 个 字 节 表示 ; 字符 型 为 8 位 ,采用 1 个 字 节 表示 。 

【 例 5-4】 分 析 如 下 C 语言 函数 cf54 和 ef55 的 目标 代码 。 这 两 个 函数 仅仅 是 演示 示例 。 


/党 示 函数 cf54 
/两 个 整 型 参数 ,返回 一 个 字符 型 值 





char cf54 int para，int parb) 


| 
int dvar; // 整 型 变量 
dvar=( char) ( 13* para) + 19 *( char) parb; 
retum dvar; 

] 

// 演 示 函 数 cf5 

/一 个 字符 型 参数 ,返回 一 个 整 型 值 

int cf58 char parc) 

{ 
unsigned char cvar= 18; /无 符号 字符 型 变量 
cvar= cf54 cvar, parc) ; /调用 函数 cf54 


cvar= cvar— 31 ; 
retum cvar; 
i 


为 了 便于 对 比 源 程序 和 目标 代码 ,不 采用 编译 优化 选项 ,编译 上 述 源 程序 后 ,可 得 到 如 下 


所 示 的 目标 代码 (标号 或 名 称 稍 有 修饰 ): 
;函数 cf54 的 目标 代码 (已 禁用 优化 ) 
_dvar$ =—4 
_ para$ =8 
_parb$ =12 
cf54 PROC 

push ebp 
my ebp, ep 
push ecx 


; dvar=( char) ( 13+ para) + 19+ ( char) parb; 


mov eax, DORD PIR_ para$ [ebp] 
imrul eax 13 
movsx ecx, al 
movsx edx BYTE PTR _ parb$ [ebp] 
imul edx, 19 
add ecx, ekx 
mv DWORD PIR _dvar$ [ebp], ecx 


mv al, BYTE PIR_dvar$ [ebp] 
mov esp, ep 
pp ep 


cf54 BP 
;函数 cf56 的 目标 代码 (已 禁用 优化 ) 
_cvar$ =—1 
_parc$ =8 
cf55 PROC 
push ebp 


;对 应 变量 dvar 的 位 置 
;对 应 参数 para 的 位 置 
;对 应 参数 parb 的 位 置 
;函数 ( 过 程 ) 开始 


iint dvar; 


;para 

X 13+ para) 

X char) ( 13+ para) 
X char) parb 

;19+ ( char) parb 
; 求 和 

;dva= 结 果 


;准备 返回 值 ( 字符 型 ) 
;撤销 堆栈 框架 
;函数 ( 过 程 ) 结束 


;对 应 变量 ovar 的 位 移 
;对 应 参数 parc 的 位 移 


/11 
/12 


/13 
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mov ep, ep ;建立 堆栈 框架 
push ecx ;unsigned char cvar 
mov BYTEPIR _cvar$ [ebp], 18 ;cvar= 18; 
- ;cvar= cf54 cvar, parc) ; 
movsx eax, BYTE PIR _ parc$ [ebp] ;有 符号 字符 型 转 整 型 /2 
push eax 
movzx ecx BYTE PTR _cvar$ [ebp] ;无 符号 字符 型 转 整 型 “Ma22 
push ecx 
call cf54 ;调用 函数 cf54 
add esp, 8 
mv BYIE PR _cvar$ [ebp], al 整 型 转 字符 型 /QB 
;cvar= cvar- 31; 

movzx edx BYTE PTR _cvar$ [ebp] ;无 符号 字符 型 转 整 型 Ma24 
sb edx 31 
mv BYTE PIR _cvar$ [ebp], dl 整 型 转 字符 型 /5 
4 ;retum cvar; 
movzx eax, BYTE PIR _cvar$ [ebp] 无 符号 字符 型 转 整 型 /@% 
mov esp, ep ;撤销 堆栈 框架 
pp ep 
ret ;返回 

cf55 BP 

从 上 述 两 段 目 标 代码 可 知 : 


(1) 在 计算 整 型 算术 表达 式 时 ,字符 型 被 自动 转化 为 整 型 。 对 于 有 符号 的 ,采用 符号 扩 
展 ; 对 于 无 符号 的 ,采用 零 扩 展 。 见 注释 含 “//@24” 的 行 ,为 了 计算 表达 式 “cvar 一 31”, 先 把 
无 符号 字符 型 零 扩 展 成 整 型 。 参 见 注释 含 “//@11” 和 “//@12” 的 行 ,也 是 如 此 ,由 于 已 经 强制 
把 整 型 转化 为 字符 型 ,但 为 了 参与 随后 的 运算 ,又 自动 把 字符 型 转化 为 整 型 。 

(2) 在 把 整 型 强制 转化 为 字符 型 时 ,仅仅 截取 低 端的 8 位 。 见 注释 含 “//@11” 的 行 ,虽然 
EAX 含有 表达 式 “13 * para” 的 值 ,但 由 于 安排 了 强制 类 型 转换 ,因此 只 使 用 AL 所 含 的 内 容 。 
类 似 地 , 见 注释 含 “//@12” 的 行 ,虽然 存储 单元 _parb $ [ebp] 含 有 参数 parb, 但 由 于 安排 了 强 
制 类 型 转换 ,因此 只 使 用 其 最 低 的 一 个 字 节 值 。 

(3) 在 赋值 时 ,如 果 类 型 不 一 致 ,自动 转换 为 目标 变量 的 类 型 。 见 注释 含 “//@23” 的 行 ， 
虽然 函数 cf54 返回 整 型 值 在 EAX 中 ,但 在 赋 给 字符 型 变量 cvar 时 ,截取 低 端的 8 位 成 为 字符 
型 值 , 还 可 见 注释 含 "//@25? 的 行 。 

(4) 在 数据 作为 调用 函数 的 参数 或 者 作为 函数 的 返回 值 时 ,如 果 类 型 不 一 致 ,自动 进行 类 
型 的 转换 。 某 种 程度 上 ,这 些 也 是 赋值 。 参 见 注释 含 “//@21” 和 “//@22” 的 行 ,以 及 注释 含 
“//@13” 和 “//@26” 的 行 。 

在 5.1.2 节 的 演示 程序 cf53 目标 代码 中 ,也 可 以 清楚 地 看 到 类 型 转换 的 相关 操作 处 理 。 


5.2.2 表达 式 求 值 


在 C 语言 中 ,对 4 个 运算 符 的 操作 数 求 值 顺序 有 明确 规定 。 

(1) 逻 辑 与 运算 符 : 先 对 左 侧 操作 数 进行 求 值 ,如 果 值 为 真 ,再 对 右 侧 操作 数 进行 求 值 。 
如 果 左 侧 操 作 数 的 值 为 假 ,不 对 右 侧 操作 数 进行 求 值 。 

(2) 逻 辑 或 运算 符 : 先 对 左 侧 操 作 数 进行 求 值 ,如 果 值 为 真 ,不 再 对 右 侧 操作 数 进行 求 值 。 
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(3) 条 件 运算 符 : 先 对 表达 式 1 进行 求 值 , 如 果 值 为 真 , 仅 对 表达 式 2 进行 求 值 。 如 果 表 
达 式 1 的 值 为 假 , 仅 对 表达 式 3 进行 求 值 。 
(4) 喜 号 运算 符 : 从 左 到 右 依次 对 各 操作 数 进 行 求 值 。 
下 面 通过 观察 目标 代码 来 分 析 C 语言 中 这 4 个 运算 符 的 操作 数 求 值 顺序 。 
【 例 5-5〗 观察 分 析 如 下 C 语言 函数 cf56 的 目标 代码 。 函 数 cf56 仅仅 是 一 个 演示 示例 ， 
它 表面 上 是 计算 3 个 表达 式 的 值 , 实 际 上 还 包含 其 他 赋值 表达 式 。 
int cf5& int para, int parb) // 演 示 函 数 cf56 
{ 
irt mn xi 
nmFrFO; 
(para>=parb) ?(mrr1) :(rF2) ; 
xt=( para <=parb) | |( mt= 10 nt= 2) ; 
xr=( para (=parb) 8&&( m+=100, nt= 200) ; 
return xt+t mt n; 
} 
为 了 便于 对 比 源 程序 和 目标 代码 ,不 采用 编译 优化 选项 ,编译 上 述 源 程序 后 ,可 得 到 如 下 
所 示 的 目标 代码 (标号 或 名 称 稍 有 修饰 ) : 
;函数 cf56 的 目标 代码 (已 禁用 优化 ) 


ty -24 :临时 变量 的 位 置 
tv -20 ; 
tw--16 
_ 唤 =- 人 2 ;对 应 变量 m 的 位 置 
_m=-8 ;对 应 变量 n 的 位 置 
_ 鸡 =-4 ;对 应 变量 x 的 位 置 
_ parag =8 ;对 应 参数 para 的 位 置 
_ parb$ = 12 ;对 应 参数 parb 的 位 置 
cf5 PROC ;函数 ( 过 程 ) 开始 

push ep 

mov ep, esp ;建立 堆栈 框架 

sb esp, 2 ;用 于 变量 mn 和 x, 以 及 临时 变量 


mv DNRDPTR_n$ [ebp], 0 
mv eax, DIORD PIR _n$ [ebp] 
mov DWORD PIR_nf$ [ebp], eax 


;el para>=parb) X nF 1) ( rr 2) ; 


mov ecx, DORD PIR_ para$ [ ebp] 
ap ecx, DWORD PIR_ parb$ [ebp] 
jl SHORT LN9a cf56 

mv DMRDPTR_nf [ebp], 1 
mov edx, DIORD PIR _né$ [ebp] 
mov DWORD PTR tvé6[ ebp], ed 
jm SHORT LMa cf56 


mFrF0; 


浏 断 作 为 条 件 的 表达 式 1 


桨 件 不 成 立 ,不 计算 表达 式 2 
;计算 表达 式 2 


;保存 到 临时 变量 
;计算 表达 式 2 后 ,不 计算 表达 式 3 
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LN5a 


LN 


LN 


LN8a 


83haaa 


pt para <= parb) | |(mr=10 nt = 2) ; 


去 8a- 


; xt=( para [=pard && mt=100, nt=200) ; 


da 


FE: 


DWORD PIR _n$ [ebp], 2 
eax DIORD PTR _n$ [ebp] 
DWORD PTR tvéS[ ebp], eax 


ecx DWORD PTR tw6[ebp] 
DWORD PIR _x$ [ebp], ecx 


edx, DNORD PIR _ para$ [ebp] 
edx DIORD PTR _ parb$ [ebp] 
SHORT LN5a cf56 


DNORD PTR tvmLebp],， 0 
SHORT UN cf56 


DWRD PTR tvnLebp], 1 


edx DWORD PTR _x$ [ebp] 
edx, DIORD PTR tvm[ebp] 
DWORD PTR _x$ [ebp], edx 


eax, DWORD PTR _ para$ [ebp] 
eax, DORD PIR _ parb$ [ebp] 
SHORT LNTa cf56 


DWORD PTR tv76| ebp], 1 
SHORT LNBa cf56 


DWORD PTR tv6Lebp], 0 
eax DIORD PTR _x$ [ebp] 


eax DORD PTR tv76[ ebp] 
DWORD PTR _x$ [ebp], eax 


;计算 表达 式 3 
;保存 到 临时 变量 


;取出 条 件 表达 式 结果 
; 赋 给 变量 x 


浏 断 左 侧 逻 辑 值 


湛 侧 为 真 ,不 计算 右 侧 表达 式 
;计算 右 侧 表达 式 


;" 假 " 送 到 临时 变量 


;" 真 " 送 到 临时 变量 


;从 临时 变量 取出 表达 式 结果 


浏 断 左 侧 逻 辑 值 


湛 侧 为 假 ,不 计算 右 侧 表达 式 
;计算 右 侧 表达 式 


” 真 " 送 到 临时 变量 


” 假 " 送 到 临时 变量 


;加 临时 变量 中 的 表达 式 结果 





;retun x+t mh ni; 


eax DIOFD PTR _n$ [ebp] ;返回 值 在 外 中 
i :撤销 堆栈 框架 
pp ep 
ret ;返回 
cf56 EP 


从 上 述 目标 代码 可 以 清楚 地 看 到 ,逻辑 与 .逻辑 或 ,条 件 及 逗号 这 4 个 运算 符 的 计算 细节 。 
5.2.3 指针 的 本 质 


指针 的 本 质 就 是 地 址 。 指 针 变量 的 值 应 该 是 存储 单元 的 地 址 。 所 谓 指针 变量 p 指向 变 
量 z, 实 际 上 就 是 变量 p 含有 变量 zx 所 在 存储 单元 的 地 址 。 在 VC 2010 环境 中 ,地 址 是 32 位 
的 段 内 偏 移 , 所 以 指针 变量 本 身 占用 4 个 字 节 的 存储 单元 ,这 与 整 型 变量 一 样 。 

很 多 时 候 ,为 了 简洁 ,常常 把 “指针 变量 "简称 “指针 ”。 

现在 结合 演示 程序 及 其 目标 代码 ,来 进一步 观察 指针 变量 和 相关 运算 符 的 实现 细节 。 

1. 指针 的 本 质 

【 例 5-6】 如 下 演示 程序 dp57 显示 输出 某 指针 变量 所 指向 变量 的 值 ,以 及 该 指针 变量 自 
身 的 值 ,分 析 其 目标 代码 。 

#include < stdio.h> /演示 程序 57 

int mair() 

{ 


printf fimts, * pi) ; // 显 示 pi 所 指向 变量 的 值 
printf fimts, pi) ; /显示 pi 自身 的 值 
] 


不 采用 编译 优化 选项 ,而 且 选 择 * 在 静态 库 中 使 用 MFC” ,编译 上 述 源 程序 后 ,可 得 到 如 下 
所 示 的 目标 代码 (标号 或 名 称 稍 有 修饰 ) : 


程序 p57 的 主要 目标 代码 ( 已 禁用 优化 ) 


OONST SEGMENT ;最 ONST 开 始 

SG3854 DB %d', OH OH 学 符 串 

OONST BEDS : 段 ONST 结束 

_TET SEQENT 上 段 _TET 开 始 
_pi$=-12 ;对 应 变量 pi 的 位 置 
_dvar$ =— 8 ;对 应 变量 dvar 的 位 置 
_fmts$ =— 4 ;对 应 变量 fmts 的 位 置 
_main PROC ; min 函数 开始 
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mov ep, ep ;建立 堆栈 框架 
sb esp,12 ;准备 用 于 局 部 变量 的 存储 空间 
:dvar= 3 
mov DNRD PIR_dvar$ [ebp], 3 
; 六 fmts=" %d\n" 
mv DWORD PIR _fints$ [ebp], OFFSET SG3854 
;pi= &dvar; 
lea 。 eax DIORD PIR _dvar$ [ebp] ;取得 变量 dvar 的 地 址 
mov DWFRDPIR _ pi$ [ebp], eax 
sprintf fimts, * pi); 

mov ecx, DIORD PTR _ pi$ [ebp] ;取得 指针 变量 pi 的 值 ( 地 址 ) 
mov edx, DWORD PTR [ecx] ;然后 取得 其 所 指向 变量 的 值 (*pi) 
push edx ;把 该 值 传递 给 printf 
mv eax, DWORD PIR _fints$ [ebp] ;取得 指针 变量 fmts 的 值 ( 地 址 ) 
push eax ;直接 传递 给 printf 
call _ printf 
add esp,8 ;平衡 堆栈 
; printf fmts，pi) ; 
mv ecx, DWRD PIR__pi$ [ebp] ;取得 指针 变量 pi 的 值 ( 地 址 ) 
push ecx :直接 传递 给 printf 
mov edx, DWORD PTR _fints$ [ebp] ;取得 指针 变量 fmts 的 值 ( 地 址 ) 
push edx ;直接 传递 给 printf 
call _ printf 
add esp, 8 ;平衡 堆栈 
; ireturn 0; 
xor eax, eax ;返回 值 是 0 
mov esp, ep ;撤销 堆栈 框架 
pp ep 
ret ;返回 

_main BP ;函数 min 代 码 结 束 

_TET BEDS : 段 _TEG 结束 


上 述 目标 代码 中 含有 两 个 段 ,分 别 是 CONST 和 _TEXT。 数 据 段 CONST 中 ,仅仅 是 由 
伪 指 令 DB 定义 的 输出 格式 字符 串 。 代 码 段 _TEXT 中 的 main 函数 的 目标 代码 流程 如 下 。 

(1) 在 建立 堆栈 框架 之 后 ,安排 3 个 局 部 变量 的 存储 空间 。 由 于 地 址 只 需要 用 偏 移 表示 ， 
所 以 指针 变量 只 占用 4 个 字 节 存储 单元 。 一 个 整 型 变量 dvar、 一 个 指向 整 型 变量 的 指针 变量 
pi 和 一 个 指向 字符 型 变量 的 指针 变量 fmts, 共 占用 12 个 字 节 。 

(2) 给 变量 赋 初 值 。 在 指令 “mov DWORD PTR _fmts $ [ebp], OFFSET SG3854” 
中 ,“OFFSET SG3854” 表 示 标 号 SG3854 的 偏 移 , 也 就 是 对 应 字符 串 的 开始 地 址 。 另 一 条 指 
邻 “lea eax, DWORD PTR _dvar$ [ebp]”, 就 是 取得 变量 dvar 的 有 效 地 址 。 

(3) 调用 库 函 数 printf, 显 示 输 出 指针 变量 pi 所 指向 变量 的 值 。 首 先 取 得 指针 变量 pi 的 
值 ; 然后 将 其 作为 地 址 ,取得 它 所 指向 的 变量 的 值 ; 最 后 将 结果 压 和 人 堆栈 ,作为 参数 传递 给 
printf。 还 有 一 个 参数 是 输出 格式 字符 串 ,应 该 是 字符 串 的 首 地 址 ,或 者 是 指向 字符 串 的 指针 
变量 的 值 ,在 这 里 是 指针 变量 fmts 的 值 。 

(4) 再 次 调用 printf 显示 输出 指针 变量 pi 自身 的 值 。 这 时 ,在 取得 pi 的 值 后 ,就 直接 将 





其 压 入 堆栈 了 。 
(5) 准备 返回 值 ,即使 得 EAX 为 0; 撤销 堆栈 框架 ,并 返回 。 

观察 如 下 演示 函数 cf58 的 目标 代码 。 假 设 在 调用 函数 cf58 时 , 实 参 指向 整 型 

数组 ,该 数组 至 少 含有 3 个 元 素 。 
int cf5& int *pit) 


【 例 5-7】 


{ 


int ss0; 
st=* (pitt) ; 
st=* (++pit) ; 
st=(*pit) ++; 
st=++(*pit) ; 
retumn s; 


/演示 函数 cf8 


/累加 第 0 个 元 素 值 ,并 指向 下 一 个 元 素 
/累加 第 2 个 元 素 值 

/累加 第 2 个 元 素 值 ,第 2 个 元 素 值 增加 1 
/第 2 个 元 素 值 增加 1, 并 累加 


不 采用 编译 优化 选项 ,编译 上 述 源 程 序 后 ,可 得 到 如 下 所 示 目 标 代 码 : 
;函数 cf58 的 目标 代码 (已 禁用 优化 ) 


a 


8 


aaaaa-… 








WORD PIR _ pit$ [ebp] eax 
ecx, DWORD PIR _ pit$ [ebp] 
edx, DWORD PTR _s$ [ebp] 
edx, DIORD PTR [ecx] 
DWORD PTR _s$ [ebp], edx 


eax, DWRD PIR _ pit$ [ebp] 
ecx, DIORD PTR _s$ [ebp] 
ecx, DNORD PTR [eax] 
DWORD PTR _s$ [ebp] ecx 
edx, DIORD PTR _ pit$ [ebp] 
eax, DWORD PTR [edx] 


;对 应 变量 s 的 位 置 
;对 应 参数 pit 的 位 置 
;函数 开始 


;建立 堆栈 框架 
;安排 局 部 变量 s 


;0; 


;Sr= 冰 (pitt 和 ; 
;EAE pit 

Es 

;ED st * pit 
EX 

;ED pit 

;DX EDX+ 4 

Pit EDX 

‘st=* (++pit) ; 


;pit 加 1 


;St=( *pi ++ 
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引 人 


;Sr=++( 半 pit) ; 











dada 
E 
3 
a 
人 


;retum s; 


esp dp 撤销 堆栈 框架 


8 aa 
8 


;返回 

cf58 EDP 

由 于 没有 优化 ,因此 上 述 函 数 cf58 的 目标 代码 显得 比较 累 歼 。 但 是 ,从 中 可 以 清楚 地 看 
到 指针 变量 的 以 下 几 个 特点 。 

(1) 形 参 pit 相当 于 一 个 指向 整 型 变量 的 指针 变量 ,为 了 取得 它 所 指向 变量 的 值 ,必须 先 
取得 它 的 值 ,再 将 其 作为 地 址 ,才能 获得 它 所 指向 变量 的 值 。 

(2) 增 减 指针 变量 与 增 减 普通 变量 有 差异 。 由 于 pit 是 指向 整 型 的 指针 类 型 ,高 级 语言 表 
达 式 中 增加 1, 实际 上 增加 4, 这 是 因为 整 型 变量 占用 4 个 字 节 存储 单元 。 当 然 , 如 果 是 指向 字 
符 型 的 指针 类 型 ,仍然 只 调整 1。 

(3) C 语言 中 的 自 增 运 算 符 位 于 变量 前 后 的 差异 。“ 先 已 后 人 ”, 与 “ 先 人 后 已 ”是 完全 不 
同 的 。 

2. 指向 指针 的 指针 

指向 指针 的 指针 ,确切 地 说 应 该 是 ,指向 指针 变量 的 指针 变量 。 指 针 变 量 也 是 变量 ,也 占 
用 存储 单元 ,当然 也 有 存储 单元 地 址 。 如 果 指 针 变 量 p 含有 指针 变量 g 所 在 存储 单元 的 地 址 ， 
那么 p 就 是 指向 g 的 指针 变量 。 

【 例 5-8】〗 观察 如 下 演示 函数 cf59 的 目标 代码 。 假 设 在 调用 函数 cf59 时 , 实 参 指向 一 个 
指针 数组 , 且 该 指针 数组 的 元 素 又 指向 一 维 整 型 数组 。 还 假设 这 两 个 数组 的 元 素 个 数 不 小 于 
另 一 个 参数 i 的 值 。 





int cf int * *ppt, int i) / 锭 示 函 数 cf 多 
{ 
int ss0; 
st=* (*pptt i) ; /ppt[g [i 
st=* (* (pptt i) ) ; /pptL i Lo] 
returmn s; 


} 
不 采用 编译 优化 选项 ,编译 上 述 源 程 序 后 ,可 得 到 如 下 所 示 目 标 代码 ; 
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;函数 cf 多 的 目标 代码 ( 已 禁用 优化 ) 








_ 叶 =- 4 ;对 应 变量 s 的 位 置 
_ppt$=8 ;对 应 参数 ppt 的 位 置 
_ 讲 = 人 2 ;对 应 参数 i 的 位 置 
cf PROC ;函数 ct 开始 
push ebp 
mov ep, ep :建立 堆栈 框架 
push ecx :安排 局 部 变量 s 的 存储 空间 
0; 
mv DNRDPIR_s$ [ebp], 0 
;t=* (*pptr 1) ; 
mov eax, DORD PIR_ ppt$ [ebp] :EAE= ppt 
mov ecx, DNORD PIR [eax] ECXE * ppt 
mov edx, DWORD PTR _i$ [ebp] EE i 
mov eax, DORD PIR_s$ [ebp] EN-=s 
add eax, DNORD PIR [ecxr edx* 4] ;EAX= st *( *pptt 4 i) 
mv DMORD PR _s$ [ebp], eax ;s EMX 
;st=* (* (pptt i) ) ; 
mv ecx, DWORD PTR _i$ [ebp] 
mv edx, DWRD PIR _ ppt$ [ebp] 
mov eax, DNORD PTR [edxr ecxk 4 
mv ecx, DIORD PTR__s$ [ebp] 
add ecx, DWORD PTR [eax] 
mov DNRD PTR_s$ [ebp], ecx 
和 ;return s; 
mov eax, DWRD PIR _s$ [ebp] 
mov esp, ep :撤销 堆栈 框架 
pp ep 
ret ;返回 
cf ENDP ;函数 cf 多 结束 


从 上 述 函 数 cf59 的 目标 代码 可 知 

(1) 在 操作 指向 指针 变量 的 指针 变量 时 ,多 了 一 次 间接 。 因 此 ,要 通过 两 次 间接 才能 访问 
最 终 的 数据 变量 (存储 单元 ) 。 

(2) 增 减 指针 变量 所 指向 的 变量 的 值 , 还 是 增 减 指针 变量 的 值 .它们 是 完全 不 同 的 。 

此 外 ,应 该 还 可 以 感受 到 32 位 存储 器 寻 址 方式 所 带 来 的 便利 。 

3. 数组 作为 形 参 

数组 作为 形式 参数 ,相当 于 指针 变量 ,实际 上 传递 的 仍然 是 地 址 。 

【 例 5-9】 如 下 演示 函数 cf510 复制 矩阵 的 某 一 行 ,参数 1 指定 二 维 数组 ,参数 2 给 出 存 
放 结 果 的 一 维 数组 ,参数 3 指定 行 。 观 察 函 数 cf510 的 目标 代码 。 

void cf51Q int matrixL ] [5], int lineL ], int i) 

, int 下 

for 上 上 0; j<5; jt) 
line[ j]= matrix[ i] []; 
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return; 
} 


不 采用 编译 优化 选项 ,编译 上 述 源 程 序 后 ,可 得 到 如 下 所 示 目 标 代码 : 


;函数 cf510 的 目标 代码 (已 禁用 优化 ) 


_j3=- 4 :对 应 变量 s 的 位 置 
_matrix$ =8 ;对 应 参数 matrix 的 位 置 
_line$ = 人 12 ;对 应 参数 line 的 位 置 
_i$=16 ;对 应 参加 i 的 位 置 
cf510 PROC ;函数 cf510 开 始 

push ep 

mov ep, ep :建立 堆栈 框架 

push ecx ;安排 局 部 变量 j 的 存储 单元 

;保护 BI 


mv DNRDPIR_ j$ [ebp], 0 
mp SHORT LN3a cf510 


:fox 二 0 j<5; jt 


LN28 cf510: 
mov eax, DORD PIR_ j$ [ebp] jt+ 
add eax 1 
mv DNRDPIR_ j$ [ebp], eax 
LN3a cf510: 
ap DDPIR_ j$ [ebp], 5 并 
jge SHORT LMa cf510 
p :sum[ j=matrix[ i [j]; 
mov ecx, DWORD PTR _i$ [ebp] ;EOE ji 
imrul ecx 20 每 行 5 个 整数 ,每 个 整数 4 字 节 
add ecx, DIORD PIR _matrix$ [ebp] ‘EOE matrixt 4 St i 
my edx DORD PIR _ i$ [ebp] :DE j 
mov eax, DIORD PIR _line$ [ebp] ;EAE line 
mov esi, DIORD PIR_ i$ [ebp] ;EI= j 
mov ecx, DWORD PIR [ecxr esi* 4 :ECE* (matrixr 杀人 ht i+ rj) 
mv DWORD PTR [eaxt edxk 4], ecx 亲 (linet 4 j) = EX 
JjJmp ”SHORT LN2a cf510 
LN4a cf510: 
pop esi ;恢复 I 
mov esp, ep ;撤销 堆栈 框架 
pp ep 
ret ;返回 
cf510 BP 


从 上 述 演示 函数 cf510 的 目标 代码 可 知 : 

(1) 根据 数组 元 素 下 标 ,计算 对 应 元 素 所 在 存储 单元 地 址 的 具体 细节 。 某 个 元 素 的 地 址 
是 数组 首 地 址 加 上 一 个 位 移 量 , 而 位 移 量 是 元 素 序号 乘 上 元 素 的 尺寸 。 元 素 尺寸 是 指 一 个 元 
素 占用 存储 单元 的 字 节 数 ,就 是 高 级 语言 中 运算 符 sizeof 返回 的 结果 。 对 一 维 数组 而 言 ,序号 
就 是 下 标 值 ; 对 二 维 数组 而 言 ,序号 等 于 行 号 乘 上 行 宽 再 加 上 列 号 。 二 维 数组 作为 形 参 时 , 需 
要 明确 第 二 维 的 上 限 , 即 每 行 的 元 素 个 数 ,缘由 在 此 。 
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(2) 当 指针 变量 作为 参数 ,或 者 数组 作为 参数 时 ,实际 上 提供 了 存储 单元 的 地 址 。 这 就 意 
味 着 可 以 方便 地 存 取 对 应 的 存储 单元 。 于 是 ,函数 不 仅 可 以 获取 若干 数据 ,而 且 能 够 提供 若干 
数据 。 换 名 话说 ,除了 函数 的 返回 值 外 ,利用 指针 变量 参数 ,函数 可 以 返回 若干 数据 。 


4. 调用 相关 函数 


现在 来 看 调用 上 述 演 示 函 数 cf58、cf59 和 cf510 的 具体 细节 。 
【 例 5-10】 如 下 演示 程序 dp511, 分 别 调用 了 函数 cf58、cf59 和 cf510, 观 察 调用 过 程 的 目 


标 代码 ,了 解 调 用 的 具体 细节 。 
#include < stdia h> 
int cf58 int *pit) ; 
int cf9X int **ppt, int i) ; 


/演示 程序 dp511 


void cf51Q int matrix[ ] [5], int lineL ], int i) ; 


int mair() 
{ 
int data[3][5={ {1,2345, 


{仙人 忆 人 44 何 ， 
{ 101, 102 108 104 105} } ; 
int *pL3]={ data[ 0], datal 1], data[ 2] } ; 


int ron[5] ; 

int i; 

printk" % d\n" , cf58 data[O) ) ; 

printg" % d\n" , cf p,2) ) ; 

cf5lQ data row 0) ; 

for i=0; i<5; i+Hh 
printk" %— 4d" 

printf" \n" ) ; 

return 0; 


,row[ i]); 


] 


把 这 些 程序 放 在 一 个 项 目 中 ,编译 运行 


12 
10 
和 


/调用 of58 
/调用 cf 多 
/调用 cf510 


后 ,可 得 到 如 下 显示 结果 : 
/data[ 0] [0]+ 三 次 data[ 0] [9 
//data[ 0] [2]+ data[2] [0] 

// 第 0 行 数据 


由 于 在 调用 函数 cf58 时 ,先后 两 次 使 得 data[0][2] 自 增 1, 因 此 在 调用 函数 cf59 和 函数 


cf510 时 ,data 中 的 数据 已 经 发 生 了 改变 。 


不 采用 编译 优化 选项 ,而 且 选 择 “ 在 静态 库 中 使 用 MFC”, 编 译 上 述 源 程序 dp511 后 ,可 得 
到 如 下 所 示 的 目标 代码 ,为 了 简化 , 仅 列 出 了 调用 这 3 个 函数 前 后 的 目标 代码 (标号 等 有 所 


修饰 ) : 
;dp511 的 部 分 目标 代码 


; printfs %d\n", cf58 data[ 0) ) ; 


lea eax, DNORD PIR_data$ [ ebp] 
push eax 

call cf58 

add esp, 4 


;得 到 data[ 0 对 应 的 地 址 值 
:传递 data[ 0] 
;调用 函数 cf58 
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push eax 

push OFFSET S63864 
call _ printf 
add esp, 8 


;printk" % d\n" , cf p,2) ) ; 
push 2 
lea ecx, DNORD PIR_ p$ [ebp] 
push ecx 


add esp, 8 


;EMX 含 cf 返回 值 
输出 格式 字符 串 首 地 址 人 栈 


:传递 和 人口 参数 二 

;得 到 指针 数组 p 的 首 地 址 
:传递 p 

;调用 函数 cf 多 


;EM 含 cf 多 的 返回 值 
输出 格式 字符 串 首 地 址 入 栈 


传递 第 三 个 人 口 参数 
;得 到 数组 row 的 首 地 址 
;传递 row 

;得 到 数组 data 的 首 地 址 
;传递 data 

:调用 函数 cf510 


上 述 目 标 代码 给 出 了 调用 函数 cf58、cf59 和 cf510 的 具体 实现 细节 ,从 中 不 仅 可 以 看 到 调 


用 时 传递 多 种 类 型 实 参 的 情况 ,而 且 还 可 以 看 到 获得 相关 地 址 的 方法 。 此 外 还 可 以 看 到 函数 
嵌 套 调用 的 实现 情况 。 


5.2.4 结构 体 变 量 


在 C 语言 中 ,程序 员 自 己 能 够 声明 数据 类 型 ,这 样 的 数据 类 型 称 为 结构 体 类 型 。 利 用 结 


构 体 类 型 ,可 以 把 描述 一 类 对 象 的 若干 个 不 同类 型 的 数据 项 组 织 成 一 个 整体 ,从 而 体现 这 些 数 
据 项 的 相关 性 。 可 以 按 需 声明 各 种 各 样 的 结构 体 类 型 ,用 于 描述 具体 的 对 象 。 
在 声明 结构 体 类 型 之 后 ,可 以 定义 该 结构 体 类 型 的 变量 ,也 就 是 结构 体 变量 。 


下 面 结合 演示 程序 及 其 目标 代码 ,来 进一步 观察 涉及 结构 体 变量 操作 处 理 的 实现 细节 。 
【 例 5-11】 如 下 演示 程序 dp512, 声 明了 一 个 结构 体 类 型 ,还 调用 了 有 关 演 示 函 数 cf513 


和 cf514, 观 察 其 目标 代码 。 


#include < stdio h> 
struct ”STUDENT 
{ 
int num; 
char name| 14]; 


/演示 程序 dp512 
/声明 结构 体 类 型 SLUDENT 


// 整 型 ( 4 字 节 ) 
/字符 型 数组 ( 6 字 节 ) 





int 。 score // 整 型 ( 4 字 节 ) 
char grade; /字符 型 (4 字 节 ) 
上: 
char cf514 struct STUDENT stux) ; /声明 函数 原型 
char cf514 struct STUDENT * pp) ; /声明 函数 原型 
MA /定义 全 局 结构 体 变量 zharg 
struct STUDENT zhane={ 108" ZHANG" ,88.'3'} ; 
MA/ 
int mair() 
{ 
struct ”STUDENT stu: /定义 结构 体 变 量 
char gl, g; /定义 字符 型 变量 
stuF zhang; // 结 构 体 变量 赋值 
stu nuF 108; /结构 体 成 员 赋 值 
stu name[ 习 ='E'; 1/ 结构 体 成 员 的 元 素 赋值 
printk" %s=%d\n" , stuneme, stunum) ; 
gl= cf513 stu) ; // 实 参 是 结构 体 变量 
2 cf514 &stu) ; // 实 参 是 结构 体 变量 的 地 址 
printk" gf=%o, ge% Aan", gl, 82) ; 
retum 0; 


] 
不 采用 编译 优化 选项 ,而 且 选 择 “ 在 静态 库 中 使 用 MFC”, 编 译 上 述 演示 程序 dp512 后 ,可 
得 到 如 下 所 示 的 目标 代码 段 (标号 等 稍 有 修饰 ) : 


_TET SEGMENT 上 段 _TET 开始 

_stu$ =-2 ;变量 su 的 位 置 

_21$=-2 ;变量 gl 的 位 秆 

_28=-1 ;变量 多 的 位 置 

_main PROC ;函数 main 开始 
push ep 
mov ep, ep ;建立 堆栈 框架 
sb esp, 2 ;安排 局 部 变量 的 存储 空间 
push esi ;保护 Bl 征 I 
push edi 
: ;stuF zhang; 
my ex7 ;结构 体 变量 占用 7 个 双 字 ( B 字 节 ) 
mv esi, OFFSET zhanga @ STUDENT ;设置 源 结 构 体 变量 首 地 址 
lea edi, DNOFD PIR_stu$ [ebp] ;获得 目标 结构 体 变量 首 地 址 
rep movsd ;复制 整个 结构 体 变量 

DWORD PTR _stu$ [ebp], 108 ;stu nunF 108; 


:| 


BYTE PIR _stu$ [ebpr 6], 8 


eax DORD PIR _stu$ [ebp] 
eax 

ecx DIORD PTR _stu$ [ebpt 4] 
eCX 

OFFSET S09870 


BE 


;stuname[ 2]|='E'; Ma1 


;printfk" %s=% d\n" , stunam, stunum) ; 


;传递 stunm 

; [@2 

;传递 stu rame 

;传递 显示 格式 字符 串 首 地 址 
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call _ printf 
- :gl= cf513 stu) ; 
add esp, -16 : 栈 顶 安排 参数 占用 的 空间 Ma3 
;实际 B 个 字 节 ( 加 应 平衡 忆 字 节 ) 
mov ex7 ;结构 体 变量 su 占用 7 个 双 字 
lea esi, DIORD PIR_stu$ [ebp] ;获得 变量 su 首 地 址 
mv edi, esp ;设置 位 于 堆栈 的 参数 首 地 址 
rep movsd ;传递 实 参 ( 结构 体 变 量 stu) 
call cf513 ;调用 函数 cf513 
add esp, 2B ;平衡 堆栈 
mv BYIEPIR _gl$ [ebp], al ;保存 返回 结果 
;8 cf5l4 &stu) ; 
lea edx, DIORD PIR _stu$ [ebp] ;获得 变量 su 的 地 址 
push edx ;传递 su 的 地 址 
call cf514 ; cf514 ;调用 函数 cf514 
add esp, 4 ;平衡 堆栈 
mv BYEPR_g2$ [ebp], al ;保存 返回 结果 
printfk" gl=%c,gs%on", gl, 22) ; 
movsx eax BYTE PIR_g2$ [ebp] 
push eax 
movsx ecx, BYTE PIR _g1$ [ebp] 
push ecx 
push ”OFFSET SG3871 ;传递 显示 格式 字符 串 首 地 址 
call _ printf 
add esp, 12 平衡 堆栈 
xor eax, eax ;return 0; 
pp edi 恢复 印 | 和 EI 
pp esi 
mov esp, ep ;撤销 堆栈 框架 
pp ep 
ret 
_main BP ;函数 min 代 码 结束 
_TET BNDS : 段 _TEG 结束 


从 上 述 dp512 的 main 函数 目标 代码 可 知 : 

(1) 结构 体 变量 之 间 的 赋值 ,是 完整 复制 结构 体 变量 所 占用 的 存储 单元 。 这 里 为 了 提高 
效率 ,采用 了 字符 串 传送 指令 ,复制 了 7 个 双 字 。 如 果 结 构 体 变量 占用 的 存储 单元 字 节 数 较 
小 ,可 能 会 利用 若干 条 MOV 传送 指令 进行 复制 。 因 此 ,虽然 结构 体 变量 之 间 的 赋值 比较 简 
单 ,但 效率 较 低 。 

(2) 结构 体 变量 作为 参数 ,在 通过 堆栈 传递 时 ,也 是 完整 复制 结构 体 变量 。 因 此 这 种 传递 
方式 ,调用 时 效率 较 低 。 这 里 在 调用 函数 cf513 时 ,复制 结构 体 变量 stu 到 栈 顶 。 具 体操 作 分 
为 两 步 : 首先 在 栈 顶 安排 28 字 节 的 存储 单元 ,然后 整体 复制 。 这 相当 于 执行 若干 条 压 栈 操作 
指令 。 在 注释 带 //@3 的 行 是 指令 "add esp, 一 16”, 似 乎 在 栈 顶 只 安排 了 16 个 字 节 ,但 加 上 
此 前 调用 库 函 数 printf 返回 后 本 应 该 平衡 的 12 个 字 节 ,实际 上 确实 安排 了 28 个 字 节 。 

(3) 与 传递 其 他 类 型 变量 的 地 址 一 样 .传递 结构 体 变量 的 地 址 很 简单 。 因 此 ,通过 传递 地 
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址 的 方式 来 传递 结构 体 变 量 参数 ,这 种 方法 效率 较 高 。 

(4) 这 里 结构 体 类 型 STUDENT 的 变量 占用 28 个 字 节 。 成员 num 和 score 是 整 型 ,分 
别 需 要 4 个 字 节 。 成 员 name 是 字符 型 数组 ,虽然 14 个 元 素 , 只 需要 14 个 字 节 ,但 为 了 以 4 字 
节 对 齐 , 所 以 多 两 个 字 节 。 成 员 grade 是 字符 型 ,同样 为 了 对 齐 , 又 多 3 个 字 节 。 从 上 面 使 用 
串 操作 指令 可 知 , 采 用 4 字 节 对 齐 是 比较 好 的 选择 。 注 意 ,在 项 目 属性 页 中 的 配置 属性 中 ,在 
C/C++ 项 下 ,有 代码 生成 的 结构 成 员 对 齐 子 项 ,通过 该 子 项 ,可 以 对 结构 体 类 型 成 员 的 对 齐 作 
出 适当 选择 。 

注意 上 述 目 标 代码 中 注释 带 //@1 或 者 //@2 的 行 。 已 知 “_stu$ [ebp]” 表 示 结 构 体 变量 
stu 的 有 效 地 址 ,于 是 ”stu$ [ebp 十 4]? 表 示 结 构 体 变量 stu 内 第 4 个 字 节 的 地 址 ,也 就 是 成 
员 name 的 首 地 址 。 实 际 上 ,符号 ”stu$ ”代表 常数 一 32, 所 以 “_stu$ [ebp 十 4]” 相 当 于 “[ebp 
一 28]”。 类 似 地 ,“_stu$ [ebp 十 6]” 表 示 结 构 体 变量 stu 的 成 员 name 的 第 2 个 元 素 。 

【 例 5-12】 比较 分 析 如 下 演示 函数 cf513 和 cf514 的 源 程 序 和 目标 代码 。 在 上 述 演示 程 
序 dp512 中 为 调用 这 两 个 函数 ,已 声明 了 其 原型 。 

/镇 函数 cf513 

char cf513 struct STUDENT stux) 

{ 

if stux score >= 80) 
Stux gradet+ = 1; 
return stix grade; 

/大 示范 数 cf514 

char cf514 struct STUDENT * pp) 

{ 

if pp- > score >= 80) 
pp- > gradet =1; 
retun pp- > grade; 

} 

上 述 这 两 个 演示 函数 的 本 质 区 别 是 参数 不 同 。 函 数 cf513 的 形 参 是 结构 体 变 量 ; 函数 
cf514 的 形 参 是 指向 结构 体 变量 的 指针 变量 。 前 者 是 所 谓 的 值 传 递 , 而 后 者 是 所 谓 的 地 址 
传递 。 

把 这 两 个 演示 函数 和 程序 dp512 放 在 一 个 项 目 中 ,编译 后 运行 ,可 得 到 如 下 输出 : 

ZHENG= 108 
sg=4 纺 4 

由 于 调用 cf513 只 传递 了 结构 体 变 量 stu 的 值 ,因此 尽管 在 cf513 中 增加 了 结构 体 变 量 成 
员 grade 的 值 , 但 并 不 影响 变量 stu 本 身 。 

现在 来 看 它们 的 目标 代码 。 不 采用 编译 优化 选项 ,编译 上 述 演示 函数 后 ,可 得 到 如 下 所 示 
的 目标 代码 : 


演示 函数 cf513 的 目标 代码 
_stux$ =8 ;参数 shx 的 位 置 
cf513 PROC 

push ebp 


mov ep, ep 
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ap ”DORD PTR__stod [ebpr 2], 80 
jl SHORT LNle cf513 


movsx eax, BYTE PIR__stud4 [ ebp+ 24] 

add eax 1 

mov BYIEPIR_stwx$ [ebpr 2], al 
LN1@ cf513: 


mv al, BYTE PIR_stwx$ [ebpr 2 
pp ep 
ret 

cf513 ENP 


;演示 函数 cf514 的 目标 代码 
_pp$=8 
cf514 PROC 

push ep 

mov ebp, esp 


mov eax, DWORD PIR _ pp$ [ebp] 
amp DNRD PTR [eaxr 20]，80 
jl SHORT LNe cf514 


mv eax, DWORD PTR_ pp$ [ebp] 
mv BYTE PTR [eaxt 2], dl 
LN1@ cf514: 








mov ecx, DWORD PIR_ pp$ [ebp 
mv al, BYTE PIR [ecx+ 2] 
pop 


ep 
ret 
cf514 BP 
从 上 述 目 标 代码 可 知 : 


;if stux score >= 80) 
;直接 访问 成 员 score, 并 比较 


;Stix. gradet+ = 1; 
;直接 访问 成 员 grade 


ireturn stix grade; 


;参数 stx 的 位 置 


iif pp- > score >= 80) 
;取得 结构 体 变量 的 地 址 
;间接 访问 成 员 score 


;pp- > gradet =1; 
;取得 结构 体 变 量 的 地 址 
;间接 访问 成 员 grade 
;间接 访问 成 员 grad 更 新 ) 


;retum pp- > grade; 


(1) 在 函数 cf513 中 ,直接 访问 位 于 堆栈 的 结构 体 变量 及 其 成 员 ,比较 简便 ,但 对 其 修改 操 
作 并 不 会 影响 调用 实 参 的 原始 值 。 

(2) 在 函数 cf514 中 ,为 了 访问 结构 体 变 量 及 其 成 员 ,首先 从 堆栈 中 取得 结构 体 变量 的 地 
址 (指针 变量 值 ) ,然后 再 访问 结构 体 变量 及 其 成 员 。 这 样 做 多 了 一 个 步骤。 但 是 ,对 结构 体 成 
员 的 修改 操作 能 够 影响 原始 值 ,从 而 可 以 保存 修改 结果 。 

(3) 结构 体 成 员 score 和 grade 的 存储 单元 地 址 都 是 双 字 对 齐 的 。 





5.3 C++ 部 分 功能 实现 细节 


C++ 语言 引入 了 一 些 不 同 于 C 语言 的 非常 有 用 的 语法 特性 ,如 引用 、 重 载 和 虚 函 数 等 。 本 
节 通 过 分 析 目标 代码 来 观察 这 些 特 性 的 实现 细节 。 


5.3.1 引用 


引用 (Reference) 是 C++ 语言 对 C 语言 的 重要 扩充 。C++ 对 引用 的 表述 为 : 引用 就 是 某 一 
变量 (目标 ) 的 一 个 别名 ,对 引用 的 操作 与 对 变量 直接 操作 完全 一 样 。 所 谓 别 名 , 即 是 给 一 个 已 
经 被 命名 的 实体 赋予 另 一 个 命名 的 含义 。 这 样 的 表述 很 容易 使 程序 员 把 引用 理解 为 一 种 实体 
的 命名 方法 而 非 一 个 实体 。 下 面 通过 分 析 C++ 源 代码 对 应 的 目标 代码 来 观察 引用 的 本 质 。 

【 例 5-13】 分 析 演 示 程 序 dp515 的 目标 代码 。 

如 下 演示 程序 dp515 定义 了 一 个 整 型 变量 test_var, 并 定义 了 一 个 引用 ref_var 作为 test_ 
var 的 别名 。 同 时 , 源 程序 还 定义 了 两 个 指针 变量 。 其 中 ,poi_var 指向 变量 test_var, 而 poi_ 
ref 指向 变量 test_var 的 引用 ref_var。 源 程序 中 //@3、//@5 和 //@7 行 的 代码 分 别 通过 变 
量 、 变 量 的 引用 和 变量 的 指针 3 种 方式 进行 了 赋值 操作 ,并 输出 这 个 变量 的 值 。 


#include < iostream> /| 演示 程序 dp515 
using namespace std; 
int mair() 
{ 
int test_var=1; 
int 8&ref_var= test_var; 
int *poi_var= &test_ var; /1 
int *poi_ref= &ref_var; /2 
VU 
cout <<" poi_var=" << poi_var << endl; /显示 poi_var= 00CFDDC 
cout<<" poi_ref=" << poi_ref << endl; /显示 poi_var= 00CFDDC 
MA 
test_var= 1; /3 
cout <<" test_var=" << test_var << endl; /@4 显 示 test_var=1 
ref_var= 2; m5 
cout <<" test_var=" << test_var << endl; /@6 显 示 test_var=2 
* poi_var= 3; /7 
cout <<" test_var=" << test_var << endl; // 显 示 test_var=3 
retumn 0; 


} 

从 上 述 演 示 程 序 dp515 的 运行 输出 结果 可 以 看 出 ,在 //@1 和 //@2 行 代码 所 取得 的 变量 
test_var 的 地 址 和 它 的 引用 ref_var 的 地 址 是 相同 的 。 这 一 结果 似乎 反映 了 引用 并 没有 独立 
的 存储 空间 。 即 引用 就 是 代表 了 被 引用 的 实体 ,而 其 自身 并 不 是 一 个 实体 ,所 以 引用 的 地 址 与 
被 引用 实体 的 地 址 相同 。 同 时 ,在 //@3 行 到 //@6 行 的 代码 也 似乎 反映 了 对 引用 的 操作 与 对 
被 引用 实体 的 直接 操作 完全 一 样 。 

下 面 通过 观察 由 上 述 演示 程序 dp515 的 汇编 格式 目标 代码 来 分 析 C++ 中 引用 的 实现 方 
法 ,并 借 此 了 解 引 用 的 本 质 。 
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不 采用 编译 优化 选项 ,编译 上 述 源 程序 。 为 了 突出 重点 ,便于 理解 ,对 汇编 格式 目标 代码 
进行 了 适当 的 简化 处 理 , 省 略 了 对 应 输入 输出 流 操 作 的 目标 代码 。 


;p515 的 部 分 目标 代码 
_IT SEGNENT 
_test_var$ =—16 
_ref_var$=- 12 
_poi_var$=-8 
_ poi_ref$ =-4 
_main PROC 

push ebp 

mo ep, ep 

sub esp, 16 


mov DWRDPIR _test var$ [ebp], 1 


lea eax, DWORD PIR_test_var$ [ebp] 
mv DWORD PIR _ref_var$ [ebp] ，eax 


lea 。 ecx DWRD PIR _test_var$ [ebp] 
mv DNRDPIR _ poi_var$ [ebp], ecx 


edx, DWORD PTR _ref_var$ [ebp]| 
DWORD PIR _ poi_ref$ [ebp], edx 


Ba 


;cout <<" poi_var=" << poi_var << endl; 
;oout <<" poi_ref=" << poi_ref << endl; 
;省略 对 应 目标 代码 


mv DWORDPIR_test_var$ [ebp], 1 


;cout <<" test_ var=" << test_var << endl; 


省略 对 应 目标 代码 


mv eax, DWRD PTR__ref_var$ [ebp] 
mv DWORD PTR [eax], 2 


;cout << ”test_var=” << test_var << endl; 


;省略 对 应 目标 代码 


mov ecx, DIORD PIR_ poi_var$ [ebp] 
mov DWORD PTR [ecx], 3 


;cout << ”test_var=” << test_var << endl; 


;省略 对 应 目标 代码 


Xor eax, eax 
mov esp, ep 


; /和 @1 对 应 变量 test_var 的 位 置 

; Ma2 对 应 引用 ref_var 的 位 置 

; /3 对 应 指针 变量 poi_var 的 位 置 
; /@4 对 应 指针 变量 poi_ref 的 位 置 


;int test_var= 1; 

i//5 

iint &ref_var= test_var; 
1 La6 

1 [7 

iint * poi_var= &test_var; 
;1 [Ma8 

;1 [Ma9 

iint * poi_ref= &ref_var; 
;1 Va10 

; [@11 





TET BDS 

在 上 述 汇 编 格式 目标 代码 中 ,以 注释 形式 给 出 了 源 代码 。 对 应 汇编 格式 指令 清晰 地 反映 
了 引用 的 以 下 几 个 关键 本 质 。 

(1) 引用 具有 独立 的 存储 单元 。 从 //@7 行 可 知 , 引 用 ref_var 在 堆栈 中 ,对 应 的 位 置 是 _ 
ref_var$ ,在 //@2 行 说 明了 _ref_var$ 的 值 ,也 就 是 相对 于 EBP 的 位 置 。 由 此 可 见 , 引 用 也 
作为 局 部 变量 。 

(2) 由 //@6 和 //@7 行 说 明 , 在 引用 中 存储 的 是 被 引用 实体 的 地 址 ,这 与 指针 变量 类 似 。 

(3) 既然 引用 有 独立 的 存储 空间 , 那 为 什么 程序 所 取得 的 变量 test_var 的 地 址 和 它 的 引 
用 ref_var 的 地 址 是 相同 的 呢 ? 对 比 //@8 行 和 //@10 行 不 难看 出 原因 。C++ 编 译 器 在 取 引 
用 的 地 址 时 并 没有 利用 lea 地 址 取出 引用 实际 的 存储 空间 的 地 址 ,而 是 用 mov 指令 直接 获取 
了 引用 的 内 容 。 而 引用 的 内 容 就 是 被 引用 实体 的 地 址 。 

(4) 由 //@13、//@14 行 和 //@15、//@16 行 说 明 , 通 过 引用 访问 被 引用 实体 的 实质 和 通 
过 指针 访问 是 相同 的 。 因 此 ,对 引用 的 操作 与 对 被 引用 实体 的 直接 操作 完全 一 样 的 说 法 并 不 
十 分 准确 。 应 该 说 对 引用 的 操作 与 对 被 引用 实体 的 直接 操作 所 取得 的 效果 是 相同 的 。 

综 上 所 述 , 引 用 从 存在 形式 和 所 存放 的 内 容 上 来 讲 与 指针 没有 本 质 的 区 别 ,而 引用 不 同 于 
指针 的 特性 从 根本 上 讲 是 编译 器 所 赋予 的 。 


5.3.2 通过 引用 传递 参数 


如 果 和 希望 被 调 函 数 改变 主 调 函 数 中 变量 的 值 , 在 C++ 语言 中 ,经 常 采 用 引用 类 型 的 函数 参 
数 , 这 样 设计 既 能 够 传递 地 址 ,又 能 够 保持 程序 简洁 。 同 样 的 要 求 ,在 C 语言 中 ,只 能 采用 指 
针 类 型 的 参数 。 

【 例 5-14】 比较 分 析 如 下 演示 程序 dp516 中 函数 tfl 和 tf2 的 目标 代码 。 其 中 ,函数 tf1 
的 参数 是 指针 类 型 ,函数 tf2 的 参数 是 引用 类 型 。 


#include < iostrean> /演示 程序 dp516 
using namespace std; 
void tfK int*p) 
{ 
[Sl 
return; 
} 
次 
void tf int &) 
{ 
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A 
tfK test_ var) ; 
tf2 test_var) ; 
cout <<" test var=" << test_ var << endl; // 显 示 test_var=3 
retum 0; 
} 
从 上 述 源 代码 可 以 看 到 ,使 用 引用 类 型 的 参数 有 两 个 明显 的 优点 : 其 一 ,在 调用 函数 时 ， 
实 参 直接 采用 变量 ,而 非 变 量 地 址 ; 其 二 ,在 函数 内 部 可 以 直接 通过 形 参 名 称 来 访问 参数 ,而 
无 须 间 接 运 算 符 ( 星 号 )。 这 些 使 得 程序 的 书写 和 阅读 都 变 得 更 清晰 和 直观 。 
不 采用 编译 优化 选项 ,编译 上 述 源 程序 ,可 得 到 如 下 所 示 的 汇编 格式 的 目标 代码 。 为 了 突 
出 重点 ,主要 保留 了 对 应 3 个 函数 的 目标 代码 ,省 略 了 其 他 内 容 。 
;演示 程序 qo516 的 部 分 目标 代码 (已 禁止 优化 ) 
;函数 tfl 的 目标 代码 
_p=8 ;参数 p 的 位 置 
32tfloe@ YAPAHD Z PROC ;函数 tf1 开 始 


{*p) ++ 
mv eax, DWRD PIR_ p$ [ebp] ; Ma1 


HfI@@ YAPAHZ ENP 
;函数 tf 的 目标 代码 


_r$=8 ;参数 r 的 位 置 
tf2@ YAAAH Z PROC ;函数 t2 开 始 


2Xtf2e@YAAHZ EP 


;函数 main 的 目标 代码 
_test var$=- 4 ;变量 test_var 的 位 置 





_main PRC ;函数 min 的 开始 


;保留 变量 test_var 的 存储 单元 
;int test_var= 1; 
mv DMD PTR_test var$ [ebp], 1 
itfK &test_var) ; 
lea eax, DWRD PIR_test_ var$ [ebp] 


call #2 @ YAMMHOZ ; [@4 


si <<" test_ var=" << test_var << endl; 
;省略 相 应 目标 代码 


XOr €ax, eax 
mY esp, ebp 
pp ep 
ret 0 

main BP 

从 上 述 对 应 main 函数 的 目标 代码 可 知 ,在 调用 函数 tfl 和 函数 tf2 时 ,除了 在 //@3 行 
和 //@4 行 所 调用 的 函数 名 不 同 以 外 ,其 他 部 分 完全 相同 ,包括 传递 参数 的 方法 和 传递 参数 的 
内 容 , 还 包括 返回 后 平衡 堆栈 的 方法 。 传 递 给 被 调 函 数 的 参数 都 是 变量 test_var 的 地 址 。 

从 上 述 对 应 函数 tfl 和 函数 tf2 的 目标 代码 可 知 , 这 两 段 代 码 事实 上 完全 相同 。 实 现 函 数 
功能 (参数 值 加 1) 的 步骤 为 : 从 堆栈 中 取得 参数 ( 即 变 量 的 地 址 ); 根据 地 址 取得 变量 的 值 ; 
值 增加 1; 再 次 取得 变量 的 地 址 (参数 ); 根据 地 址 ,把 值 送 到 变量 。 这 个 操作 步骤 显得 累 歼 ， 
这 是 “禁止 优化 ”的 缘故 。 

由 此 进一步 说 明 引 用 和 指针 的 本 质 是 相同 的 ,都 是 通过 变量 的 地 址 来 间接 访问 变量 的 一 
种 方法 。C++ 请 言 新 增 了 引用 这 种 类 型 ,使 得 数据 的 间接 访问 在 C++ 源 代码 中 以 直接 访问 的 
形式 出 现 , 简 化 了 程序 ,减少 了 错误 ,大 大 改善 了 程序 的 可 阅读 性 和 可 维护 性 。 


5.3.3 函数 重 载 


为 了 方便 程序 设计 ,C++ 语言 允许 在 同一 范围 中 声明 几 个 功能 类 似 的 同名 函数 ,但 是 这 些 
同名 函数 的 形式 参数 ( 指 参数 的 个 数 、 类 型 或 者 顺序 ) 必 须 不 同 ,也 就 是 说 利用 函数 名 相同 的 车 
干 函数 完成 不 同 的 运算 功能 ,这 就 是 重 载 函 数 。 通 常 利用 重 载 函数 实现 功能 相似 而 所 处 理 的 
数据 类 型 不 同 的 需求 。 根 据 使 用 场合 的 不 同 , 函 数 重 载 分 为 非 成 员 函 数 重 载 和 类 成 员 函 数 重 
载 两 种 情形 。 

1. 非 成 员 函 数 重 载 

【 例 5-15】 分 析 演 示 程 序 dp517 的 目标 代码 ,观察 非 成 员 函 数 重 载 的 实现 细节 。 
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由 C++ 语言 编写 的 演示 程序 dp517 有 两 个 tfc 函数 。 它 们 的 函数 名 相同 ,参数 个 数 相同 ， 
但 参数 类 型 不 同 。 这 两 个 tfc 函数 是 非 成 员 函 数 ,它们 构成 重 载 关 系 。 


#include < iostream> 
Using namespace std; 
int tfd int i) 


cout <<" int” << i << endl; 
retum 0; 


void tfd char 中 ) 


cout <<" char” < 中 << endl; 
return; 


int mair() 


tfd 2) ; 
tfd 'A) ; 
td At "B) ; 
retun 0; 
} 


// 演 示 程 517 


// 参 数 整 型 


/显示 int2 
/显示 charA 
/显示 int131 


为 了 演示 ,上 述 main 函数 先后 3 次 调用 了 函数 tfc, 但 调用 实 参 的 类 型 不 同 。 第 一 次 调用 
的 实 参 是 整 型 ; 第 二 次 调用 的 实 参 是 字符 型 ; 第 三 次 调用 的 实 参 也 是 整 型 ( 按 整 型 进行 运 
算 )。 现 在 通过 汇编 格式 的 目标 代码 来 观 查 这 3 次 调用 的 实现 细节 。 

不 采用 编译 优化 选项 ,编译 上 述 演示 程序 dp517, 可 得 到 如 下 所 示 的 汇编 格式 的 目标 代 
码 。 为 了 突出 重点 ,只 保留 了 main 函数 的 目标 代码 。 


;演示 程序 517 的 目标 代码 ( 禁止 优化 ) 


_main PROC 
push ebp 
mov ebp, ep 


;tfd 2) ; 

; 调用 参数 为 整 型 的 函数 tfc 
;tfd 'A) ; 

; 调用 参数 为 字符 型 的 函数 tfc 
;tfd 'A+ 'B') ; 

; 调用 参数 为 整 型 的 函数 tfc 


;retum 0; 





从 上 述 目标 代码 可 知 ,在 mian 函数 中 的 3 次 函数 调用 所 调用 函数 的 名 称 是 不 相同 的 。 第 
一 次 和 第 三 次 调用 的 是 函数 ? tfc@@YAHHG@Z, 第 二 次 调用 的 是 函数 ?tfc@@YAXD@7Z。 
由 此 可 见 , 虽 然 源 程序 中 重 载 函数 的 名 称 相同 ,但 编译 器 赋予 了 它们 不 同 的 名 称 。 

C++ 语 言 的 编译 器 ,能 够 根据 调用 卫 数 时 实 参 的 不 同情 形 ,决定 采用 哪 一 个 函数 。 编 译 器 
判断 重 载 函数 的 过 程 分 为 以 下 3 个 步骤 。 

(1) 第 一 步 是 确定 候选 函数 集 。 所 谓 候 选 函 数 , 就 是 与 被 调用 函数 同名 的 函数 。 

(2) 第 二 步 又 可 分 为 两 小 步 。 第 一 小 步 从 候选 函数 中 挑 出 可 行 函数 。 可 行 函 数 的 函数 参 
数 个 数 与 调用 的 函数 参数 个 数 相同 ,或 者 可 行 函数 的 参数 可 以 多 一 些 , 但 是 多 出 来 的 函数 参数 
都 要 有 相关 的 默认 值 ; 第 二 小 步 是 根据 参数 类 型 的 转换 规则 将 被 调用 的 函数 实 参 转换 成 候选 
函数 的 实 参 。 

(3) 第 三 步 是 从 第 二 步 中 选 出 的 可 行 函 数 中 选 出 最 佳 可 行 函数 。 在 最 佳 可 行 卫 数 的 选择 
中 ,从 函数 实 参 类 型 到 相应 可 行 函 数 参 数 所 用 的 转化 都 要 划分 等 级 ,根据 等 级 的 划分 选 出 最 佳 
可 行 函 数 。 

2. 类 成 员 函 数 重 载 

【 例 5-16】 分 析 演 示 程 序 dp518 中 函数 main 的 目标 代码 ,观察 类 成 员 函 数 重 载 的 实现 
细节 。 

由 C++ 语言 编写 的 演示 程序 dp518 有 一 个 类 test_class, 其 中 包含 了 两 个 构成 重 载 关系 的 
函数 cftm。 在 main 函数 中 通过 对 象 分 别 调用 了 这 两 个 重 载 函 数 。 

#include < iostream> // 演 示 程 序 dp518 

Using namespace std; 

class test_class 

{ 

public: 

void cfn( int i, int j) 

{ 
cout <<" int” << i+ j<< endl; 
return; 

} 

六 

void cfm char oh) 

{ 
cout <<" char"” << 中 << endl; 
return; 


AN/ 
int mair() 
test class obj; 


bjcm( 3 4; 
cbj.cfr( 'A) ; 
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retum 0; 
} 
不 采用 编译 优化 选项 ,编译 上 述 演示 程序 dp518, 可 得 到 如 下 所 示 的 汇编 格式 的 目标 代 
码 ,为 了 突出 重点 ,只 保留 了 main 函数 的 目标 代码 。 


;演示 程序 qo518 的 部 分 目标 代码 (已 禁止 优化 ) 
_obj$ =-1 ;obj 的 位 置 


;cbj.cm(3 4 ; 


ecx DWORD PTR _obj$ [ebp] 
3cfng@ test_classa @ OAEXHHB Z ;test_class: :cfm 
;obj.cfm( 'A') ; 
push 6 
lea ecx, DWRD PIR _obj$ [ebp] 
call ?cm test_classa @ QAEXDa Z ;test_class: :cfm 
retum 0; 
xor €ax, eax 
my esp, ep 
pp ep 
ret 0 
main ENP 
从 上 述 目 标 代码 可 知 ,mian 函数 先后 两 次 调用 重 载 函数 的 名 称 并 不 相同 。 第 一 次 调用 的 
是 函数 ? cfm@test_class@Q@QAEXHHQZ. 第 二 次 调用 的 是 函数 ? cfm@test_class@ 四 
QAEXD@Z。 由 此 可 见 ,类 成 员 函 数 的 重 载 机 制 与 非 成 员 函 数 重 载 大 致 相同 。 主 要 区 别 是 由 
编译 器 生成 的 类 成 员 函 数 名 中 含有 类 名 。 
从 上 述 目标 代码 还 可 知 , 在 调用 类 成 员 函 数 后 ,无 须 平 衡 堆栈 ,事实 上 压 和 堆栈 的 参数 由 
被 调 函数 在 结束 返回 时 撤销 。 此 外 ,在 调用 类 成 员 函 数 时 ,需要 准备 好 this 指针 的 值 。 这 些 
与 类 成 员 函 数 的 调用 和 运行 机 制 有 关 ,与 函数 重 载 机制 无 关 。 


5.3.4 虚 函 数 


虚 函 数 是 在 基 类 中 声明 为 virtual 并 在 一 个 或 多 个 派生 类 中 被 重新 定义 的 成 员 函 数 。 虚 
函数 用 于 实现 多 态 性 。 通 过 指向 派生 类 的 基 类 指针 或 引用 ,访问 派生 类 中 同名 覆盖 成 员 函 数 ， 
从 而 达到 C++ 语言 所 谓 的 动态 联 编 ( 运 行 时 绑 定 ) 的 目的 。 

【 例 5-17】 分 析 演 示 程 序 dp519 的 部 分 目标 代码 ,观察 调用 虚 函 数 的 细节 。 

在 演示 程序 dp519 中 ,A2 是 Al 的 派生 类 。Al 和 A2 中 各 定义 了 一 个 普通 成 员 函 数 get， 
同时 还 各 定义 了 一 个 虚 函 数 vget。 程 序 中 有 一 个 函数 f, 参 数 是 Al 类 型 对 象 的 引用 。main 
函数 中 两 次 调用 了 f 函数 ,分 别传 递 了 Al 和 A2 对 象 的 引用 作为 参数 。 

#include < iostrean> /演示 程序 qh519 

using namespace std; 





public: 
virtual void veet() { cout<< Al::vget" << endl; retum;} 
void gt) { cout<< Al::get" << endl; return;} 

Pe 

Ee# 

class A:pblic AI 

{ 

public: 
virtual void vget) { cout<< A2::vget" << endl; return;} 
void get() { cout<< A2::get" << endl; return;} 


void cfd Al&a) 


aveet ) ; 
aget ) ; 
return; 


骨 
int mair() 


} 
编译 运行 上 述 程序 ,可 得 如 下 输出 信息 : 
Al::vget 
Al::get 
A2: :veet 
Al::get 


从 上 述 输出 结果 可 以 看 出 , 当 Al 的 对 象 作为 参数 时 ,函数 tfd 中 的 两 次 函数 调用 均 是 调 
用 了 类 Al 中 的 成 员 函 数 ; 当 参 数 换 成 A2 的 对 象 时 ,函数 tfd 中 第 一 次 函数 调用 是 调用 了 类 
A2 中 的 成 员 函 数 ,第 二 次 函数 调用 依然 调用 了 类 Al 中 的 成 员 函 数 。 也 就 是 说 ,在 函数 tfd 
中 ,第 一 个 函数 调用 在 编译 时 是 不 确定 的 。 运 行 时 得 到 的 参数 决定 了 最 终 调用 哪个 类 中 的 相 
应 函数 。 这 种 特性 称 为 动态 联 编 ( 或 运行 时 绑 定 )。 对 应 地 ,第 二 个 函数 调用 的 情形 称 为 静态 


联 编 ( 或 编译 时 绑 定 ) 。 


不 采用 编译 优化 选项 ,编译 上 述 演示 程序 dp519 ,可 得 到 如 下 所 示 的 汇编 格式 的 目标 代 
码 ,为 了 突出 重点 ,只 保留 了 main 函数 和 cfd 函数 的 目标 代码 。 从 目标 代码 可 以 清楚 地 看 到 


动态 联 编 特 性 的 实现 细节 。 
演示 程序 5f8 的 部 分 目标 代码 ( 已 禁止 优化 ) 


第 5 章 VC 目标 代码 的 阅读 理解 


187 





_$=8 
2cfdd@ YAMAAVA@@@Z PRC 


8 


main PROC 
push ebp 
my ebp, esp 
sub esp,8 


lea ecx, DWRD PIR _a1$ [ebp] 
call ?0Ma @ QAEa 7 


lea 。 ecx DWRD PTR _a2$ [ebp] 
call ?2028 @ EQ 7 


lea eax, DNORD PIR _a1$ [ebp] 
push eax 

call ?cfda @ YAMMAVAlOG@@Z 
add esp, 4 


lea ecx, DWORD PIR _a2$ [ebp] 
push ecx 
call ?fda @ YAXAAVAI@ @ @ Z 
add esp, 4 


xor eax, eax 
mov esp, gp 
pp ep 
ret 0 

main BNDP 


;参数 a 的 位 置 
;函数 cd 开始 


:aveet ) ; 
;Va1 
; /2 
; /3 
;//4 
;1V[a5 
aget ) ; 


:Al::get /6 
;return; 
;函数 cfd 结 束 


;对 象 有 地 址 的 位 置 
;对 象 af 地 址 的 位 置 


;AI al; 


;调用 构造 函数 
Ja2; 


;调用 构造 函数 
;cfd al) ; 


从 上 述 目 标 代码 可 知 ,main 函数 在 调用 函数 cfd 时 , 先 将 对 象 al 或 者 a2 的 地 址 作为 参数 
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压 人 了 堆栈 ,这 是 因为 形 参 是 引用 类 型 。 这 与 5. 4. 2 节 中 描述 的 情况 一 致 。 

在 函数 cfd 内 ,调用 a. get() 函 数 时 ,固定 地 调用 了 气 数 ? get@Al1@@QAEXXZ, 见 //@6 
行 。 这 是 在 编译 的 时 候 就 确定 的 ,属于 静态 联 编 。 因 此 ,a. get() 函数 的 调用 是 不 具有 多 态 
性 的 。 

在 函数 cfd 内 ,调用 a. vget() 函 数 时 ,步骤 比较 复杂 。 在 //@1 行 ,获取 了 由 main 函数 压 
入 堆栈 中 的 对 象 a 的 地 址 。 在 //@2 行 ,获取 了 对 象 a 的 最 前 面 4 个 字 节 的 内 容 。 这 4 个 字 节 
的 内 容 是 对 象 a 的 虚 函 数 入 口 地 址 表 的 地 址 (这 个 地 址 表 的 内 容 是 购 造 函数 安排 的 )。 在 //@ 
3 行为 成 员 函 数 调用 准备 this 指针 。 在 //@4 行 ,从 虚 函 数 入 口 地 址 表 中 获取 vget 函数 的 人 
口 地 址 。 在 本 例 中 ,由 于 类 中 只 有 一 个 虚 函 数 , 因 此 表 中 第 一 个 地 址 ( 即 edx 所 指向 的 内 容 ) 就 
是 vget 的 人 口 地 址 。 在 //@5 行 代码 通过 入 口 地 址 间接 调用 对 象 a 的 vget 函数 。 这 时 形 参 
对 象 a 到 底 是 实 参 对 象 al 还 是 a2 就 决定 了 被 调用 的 到 底 是 al : :vget() 还 是 a2::vget()。 由 
此 可 见 , 在 //@5 行 实际 调用 的 函数 会 随 着 传人 对 象 的 不 同 而 不 同 ,只 能 在 每 次 运行 到 该 行 代 
码 的 时 候 决 定 , 属 于 动态 联 编 。 


5.4 目标 程序 的 优化 


VC 2010 提供 的 编译 优化 选项 包括 “使 大 小 最 小 化 "和 “使 速度 最 大 化 ”, 之 前 在 分 析 目 标 
程序 时 ,经 常会 先 明确 采用 的 编译 优化 选项 。 为 了 更 好 地 阅读 理解 由 编译 器 生成 的 目标 程序 ， 
本 节 从 汇编 语言 的 角度 简单 介绍 优化 目标 程序 的 相关 概念 ,技术 和 方法 ,包括 指令 的 编码 长 度 
和 执行 时 间 , 还 有 存储 器 的 地 址 对 齐 等 。 


5.4.1 关于 程序 优化 


所 谓 优化 ,就 是 提高 目标 程序 的 效率 ,体现 在 “时 间 ” 和 ”空间 ? 两 个 方面 。 在 时 间 方面 是 执 
行 速度 最 大 化 ,在 空间 方面 是 占用 空间 最 小 化 。 在 时 间 和 空间 两 个 方面 的 效率 同时 得 到 提高 
是 最 好 的 。 但 是 ,时 间 和 空间 常常 存在 矛盾 ,所 以 有 “空间 换 时 间 " 或 者 "时间 换 空间 ”的 说 法 。 

优化 的 关键 是 算法 优化 。 假 设 希 望 计算 1.2 到 这些 整数 之 和 。 在 3.1.3 节 的 演示 函数 
cf37 实现 了 该 功能 , 它 采 用 循环 累加 的 算法 。 基 于 该 算法 ,无 论 怎样 编写 程序 ,效率 都 不 可 能 
高 。 只 有 基于 等 差 数 列 求 和 公式 (1 十 n) Xn/2, 直 接 计算 表达 式 的 值 ,效率 才 高 。 又 如 ,如 果 
采用 * 冒 泡 ? 算 法 对 数 以 万 计 的 数据 进行 排序 ,那么 无 论 如何 ,执行 效率 都 不 能 算 高 。 

本 节 从 汇编 语言 的 角度 介绍 目标 程序 的 优化 ,假设 算法 已 经 优化 或 者 算法 已 经 确定 。 

根据 前 面 介 绍 的 IA-32 系列 CPU 的 机 器 指令 可 知 , 为 了 实现 某 一 功能 ,可 以 采用 不 同 的 
指令 或 者 指令 片段 。 以 下 4 条 指令 都 可 以 使 得 寄存 器 EBX 的 内 容 为 0, 但 指令 长 度 却 并 不 相 
同 ,采用 哪 条 指令 比较 好 ,与 具体 的 场合 有 关 : 


WwW EO0 5 字 节 
XR EX 汉字 节 
SB EM ;2 字 节 
AD EMK 0 33 字 节 


因此 ,针对 不 同 的 目的 ,充分 发 挥 CPU 的 特性 ,可 望 提高 目标 程序 的 效率 。 
一 般 而 言 , 采 用 相同 的 算法 ,由 汇编 语言 编写 的 程序 效率 最 高 。 因 为 汇编 语言 更 能 充分 发 
挥 机 器 的 特性 。 但 是 ,用 汇编 语言 编程 的 工作 效率 却 是 最 低 。 
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实际 上 ,现在 高 级 语言 的 编译 器 功能 很 强劲 ,由 编译 器 生成 的 目标 代码 已 经 “足够 好 ”, 或 
者 说 好 过 普通 汇编 语言 程序 员 编 写 的 程序 。 某 种 意义 上 ,这 也 是 越 来 越 少 使 用 汇编 语言 编写 
源 程序 的 原因 之 一 。 
【 例 5-18〗 分 析 如 下 C 语言 编写 的 演示 函数 cf520 的 目标 代码 。 它 有 一 个 无 符号 字符 型 
参数 ,返回 无 符号 整 型 值 。 
unsigned int cf520 unsigned char n) // 演 示 函 数 cf520 
| unsigned int Xx, y, sum; 
Ent8; 
yn/8: 
SunF x+ y; 
return sum; 
} 
在 采用 编译 优化 选项 “使 大 小 最 小 化 ”或 者 “使 速度 最 大 化 ”, 编 译 上 述 源 程序 后 ,都 得 到 如 
下 所 示 相 同 的 目标 代码 (标号 或 名 称 稍 有 修饰 ) : 


;函数 cf520 的 目标 代码 

_ 叶 =8 ;参数 n 的 位 置 

cf520 PROC 
push ep 
mov ebp, esp 
movzx eax, BYTE PTR _n$ [ebp] En ja 
mov ecx, eax Fx 
shr ecx 3 Fv /A 
lea eax， DNORD PIR [ecxr eaxk 8] ;sumFyrt x+t 8 /a 
pp ep 
ret ;返回 

cf520 BNP 


从 上 述 目标 代码 可 知 ,VC 2010 的 编译 器 相当 “聪明 ”, 不 仅 用 寄存 器 作为 局 部 变量 ,而 且 
还 充分 利用 IA-32 系列 CPU 的 相关 指令 。 应 该 说 ,这 样 的 目标 代码 在 “时 空 ”两 个 方面 都 是 高 
效 的 。 如 果 有 需要 ,VC 2010 还 允许 不 建立 堆栈 框架 ,通过 ESP 直接 访问 由 堆栈 传递 的 参数 。 

用 寄存 器 作为 局 部 变量 能 大 大 提高 效率 。 一 方面 ,寄存 器 位 于 CPU 内 部 , 存 取 寄存 器 速 
度 最 快 ; 另 一 方面 ,表示 寄存 器 的 编码 比较 短 , 相 应 指令 的 长 度 也 就 比较 短 。 所 以 ,高 质量 的 
代码 ,一 定 是 充分 利用 寄存 器 的 代码 。 把 采用 编译 优化 的 目标 代码 与 不 采用 编译 优化 的 目标 
代码 相互 比较 , 即 可 清楚 地 看 到 这 一 点 。 

优化 与 处 理 器 关系 密切 。 从 指令 的 选用 上 ,就 可 见 一 斑 。 在 函数 cf520 的 目标 代码 中 , 注 
释 带 //@ 行 的 指令 ,就 是 与 机 器 密切 相关 的 指令 。 例 如 ,因为 IA-32 系列 CPU 不 仅 提供 了 取 
有 效 地 址 指令 LEA ,而 且 还 具有 丰富 的 32 位 存储 器 寻 址 方式 ,所 以 利用 LEA 指令 能 够 高 效 
地 计算 某 些 部 分 表达 式 。 不 仅 如 此 ,优化 还 与 处 理 器 的 其 他 方面 相关 。 对 IA-32 系列 不 同型 
号 的 处 理 器 ,优化 及 其 效果 也 存在 一 定 差异 。 


5.4.2 使 大 小 最 小 化 
“使 大 小 最 小 化 ”顾名思义 就 是 使 得 目标 程序 长 度 最 短 , 即 把 组 成 目标 程序 的 所 有 指令 长 
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度 相 加 最 小 。IA-32 系列 CPU 属于 复杂 指令 系统 的 处 理 器 ,其 指令 长 度 少 则 1 字 节 ,多 则 超 
过 了 0 字 节 。 

1. 机 器 码 格式 

机 器 指令 采用 二 进 制 编码 ,一 般 含 有 操作 码 和 操作 数 两 部 分 。IA-32 系列 CPU 通用 指令 
的 基本 编码 格式 如 图 5. 3 所 示 。 其 中 , 寻 址 方式 (ModR/M) 部 分 主要 用 于 表示 指令 操作 数 的 
寻 址 方式 ; 如 果 不 足 以 表示 ,就 会 需要 因子 变 址 基 址 (SIB) 部 分 ,由 它 进一步 表示 带 比例 因子 
的 基 址 变 址 寻 址 方式 ; 位 移 (Displacement) 部 分 用 于 表示 在 存储 器 单元 有 效 地 址 中 出 现 的 位 
移 量 ; 立即 数 (Immediate) 部 分 给 出 具体 的 操作 数据 。 这 四 部 分 与 具体 指令 有 关 , 并 不 一 定 
出 现 。 





Opcode ModR/M SIB Displacement ! Immediate ! 
操作 但 |， 寻 直 方式 上 因子 变 直 基 址 | 位移 | 下 | 
1~3 字 节 1 字 节 1 字 节 1、2 或 4 字 节 ”1、2 或 4 字 节 


5.3 机 器 码 格式 


此 外 ,在 指令 的 操作 码 之 前 ,还 可 以 出 现 多 达 4 个 不 同 的 前 级 。 例 如 ,用 于 明确 给 定 存储 
段 的 段 前 缀 ;又 如 ,出 现在 字符 串 操 作 指令 之 前 的 重复 前 缀 等。 

从 图 5. 3 可知, 机 器 指令 的 编码 长 度 有 很 大 差异 ,利用 合适 的 指令 ,可 缩短 目标 程序 的 长 
度 。IA-32 系列 CPU 机 器 指令 的 编码 大 致 有 以 下 几 项 规律 。 

(1) 常用 指令 的 操作 码 比 较 短 ,一 般 只 有 一 个 字 节 。 

(2) 如 果 指 令 只 有 一 个 寄存 器 操作 数 ,那么 这 样 的 常用 指令 可 能 只 有 一 个 字 节 。 实 际 上 ， 
8 个 寄存 器 只 需 3 位 的 编码 ,这样 可 能 把 代表 寄存 器 的 编码 合并 到 指令 的 操作 码 中 。 

(3) 如 果 指令 有 两 个 寄存 器 操作 数 ,那么 这 样 的 指令 相对 较 短 ,因为 1 字 节 的 寻 址 方式 
(ModR/M) 部 分 就 可 以 表示 两 个 寄存 器 操作 数 。 

(4) 如 果 指 令 有 存储 器 操作 数 ,并 且 采 用 32 位 的 基 址 加 变 址 寻 址 方式 ,将 会 出 现 SIB 
部 分 。 

(5) 如 果 指 令 有 存储 器 操作 数 , 并 且 有 效 地 址 中 含有 位 移 量 ,那么 将 出 现 位 移 部 分 。 有 时 
位 移 部 分 会 使 得 指令 长 度 明显 增加 。 

(6) 如 果 指 令 中 含有 立即 数 , 则 将 会 出 现 立 即 数 部 分 。 有 时 这 也 会 使 得 指令 长 度 明 显 增 
加 。 但 是 ,算术 逻辑 运算 指令 ,会 允许 立即 数 符号 扩展 。 

(7) 部 分 指令 当 操作 数 是 累加 器 EAX、AX 或 者 AL 时 ,可 能 稍 短 。 

另外 ,部 分 指令 可 能 存在 多 个 不 同 的 机 器 码 。 

【 例 5-19】 观察 如 下 指令 的 机 器 码 ,其 中 ,以 注释 形式 给 出 的 机 器 码 采 用 十 六 进 制 表示 。 


DEC EX :4 
MW EX EX ;名 以 操作 码 , 寻 址 方式 ) 
SB EX EX ;B 鸣 操作 码 , 寻 址 方式 ) 
WwW EX [EX+ EX] 如 14 操作 码 , 寻 址 方式 ,SIB) 
WW EX [EX+ EOX 1 :BHABI2 

X 操作 码 , 寻 址 方式 ,SIB, 位移 ) 
MW EX [EEX+ ECX+ 5578H :BUBBHBOMO 

X 操作 码 , 寻 址 方式 ,SIB, 位移 ) 
MW EX 1 ; 妈 010m m0 操作 码 , 立 即 数 ) 
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MV EAX 0 ;B8 9 00 0 00 操作 码 , 立即 数 ) 
AD EX1 ;80 0 操作 码 , 寻 址 方式 ,立即 数 ) 
需要 指出 ,在 机 器 码 中 表示 立即 数 \ 位 移 时 ,也 采用 “高 高 低 低 ”规则 。 
2. 大 小 最 小 化 的 方法 
除了 尽量 采用 寄存 器 作为 变量 外 ,“ 使 大 小 最 小 化 ”的 方法 是 采用 长 度 较 短 的 指令 或 者 指 
令 片 段 。 
【 例 5-20】 分 析 3.1. 3 节 演 示 函 数 cf37 的 目标 代码 。 采 用 编译 优化 选项 “使 大 小 最 小 
化 ”目标 代码 如 下 所 示 ,其 中 以 十 六 进 制 形式 表示 的 机 器 码 作为 注释 。 
;演示 函数 cf37 的 目标 代码 (" 使 大 小 最 小 化 " ) 


_mm=8 
cf37 PROC 
push ebp 5 
mov ebp, esp ;加 臣 
xor ecx, ecx ;3 09 /a 
inc ex 者 /MN EX1 
xor eax, eax ;33 00 [MXV EAX0 
ap DWORDPIR _n$ [ebp], ecx :pVDB 
jl SHORT LN cf37 NB 
LL38 cf37: 
add eax, ecx 08 0 
inc ecx 者 /LaADD EX1 
ap ecx DWRD PTR_n$ [ebp] B08 
jle SHRT LL3a cf37 EF 
LNI@ cf37: 
pp Ep a9 
ret ;03 
cf37 BNP 


对 比 在 3.1. 3 节 列 出 的 cf37 的 未 采用 编译 优化 选项 的 目标 代码 ,上 述 目标 代码 采用 了 寄 
存 器 作为 局 部 变量 ,还 调整 了 循环 控制 的 实现 。 在 此 基础 上 ,尽量 利用 长 度 较 短 的 指令 , 见 注 
释 带 //@ 的 行 。 

【 例 5-21】 分 析 如 下 函数 cf521 的 目标 代码 。 函 数 cf521 的 功能 是 根据 年 份 判断 该 年 是 
和 否 为 头 年 。 


int ”cf52K unsigned int year) / 浏 断 闫 年 的 函数 cf521 
{ 
int leap= 0; 
iK((year % 和 4F=0) 8&( year % 100 (=0)) || (year % 400==0) ) 
leap= 1; 
return leap; 


} 
采用 编译 优化 选项 “使 大 小 最 小 化 ”, 编 译 上 述 源 程序 后 ,得 到 如 下 所 示 的 目标 代码 : 
;函数 cf521 的 目标 代码 (" 使 大 小 最 小 化 " ) 
_ year$=8 ;参数 year 的 位 置 
cf521 PROC 
push ep 





mov ebp, esp 
xor ecx, ecx ;EX 作为 lep /1 
test BYIEPIR_ year$ [ebp], 3 ;year 被 4 整除 ? /Ma2 
push esi ;保护 EI 
jne SHRT LNi@ cf521 滞 , 跳 转 
mov eax, DIORD PTIR_ year$ [ebp] ;EA year 
push 10 H /3 
xor edx, edx 人 /4 
pop esi ;ESI= 100 /M5 
div esi ;计算 year % 100 
test edx, edx 整除 ? /M6 
jne SHORT LN2a cf52 ; 否 , 跳 转 
LN1@ cf521: 
my eax, DWORD PIR _year$ [ebp] ;EAE year 
xor edx, edx ? /7 
mov esi, 4m 人 
div esi ;计算 year % 400 
test edx, edx 整除 ? /[a@8 
jne ”SHORT LN3a cf521 ; 否 , 跳 转 
LN28 cf521: 
xor ecx, ecx ;leap= 1 /M9 
inc ecx ; /N10 
LN35 cf521: 
mov eax, ecx ;ENE leap 11 
pp esi ;恢复 EI 
pp gp 
ret ;返回 
cf521 BNP 


注意 上 述 目标 代码 中 注释 含 //@ 的 行 。 为 了 缩短 目标 代码 的 长 度 ,除了 采用 类 似 例 5-20 
的 方法 外 ,还 包括 利用 TEST 指令 ,避免 除 4 操作 ,这 样 处 理 既 短 又 快 ; 利用 TEST 指令 代替 
CMP 指令 ; 利用 PUSH 指令 和 POP 指令 ,给 寄存 器 ESI 赋 较 小 的 值 。 但 是 ,并 不 用 类 似 的 方 
法 给 寄存 器 ESI 赋 较 大 的 值 ,请 读者 思考 一 下 ,为 什么 ? 


5.4.3 使 速度 最 大 化 


“使 速度 最 大 化 ”就 是 使 得 执行 目标 程序 的 速度 最 快 。 影 响 目标 程序 执行 速度 的 因素 较 
多 ,不 仅 与 指令 执行 的 时 钟 数 有 关 , 而 且 还 与 高 速 缓存 (Cache) 的 命中 和 指令 执行 流水 线 的 配 
对 等 有 关 。 

1. 指令 执行 时 间 

在 理想 情况 下 ,执行 某 条 指令 的 时 间 上 等 于 该 指令 时 钟 数 C 乘 以 时 钟 周 期 了 (一 CXT)。 
假设 CPU 的 主 频 是 下, 时钟 周 期 工 则 等 于 1/F。 假设 CPU 的 主 频 是 2GB, 那 么 时 钟 周期 是 
0. 5ns。 所 谓 理想 情况 ,是 指 在 执行 指令 时 ,数据 和 指令 分 别 命中 对 应 的 高 速 缓存 。 

指令 的 时 钟 数 是 指 执行 指令 所 需 的 单位 时 间 数 。 

在 理想 情况 下 ,执行 大 部 分 常用 指令 的 时 钟 数 较 小 ,有 许多 仅 为 1; 如 果 访 问 存储 器 ,可 能 
增加 1 或 2 个 时 钟 。 
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执行 指令 的 时 钟 数 与 寻 址 方式 有 关 。 寄 存 器 寻 址 方式 最 快 ,利用 寄存 器 变量 能 够 提高 执 
行 效率 ; 如 果 两 个 操作 数 中 一 个 是 寄存 器 操作 数 , 另 一 个 是 存储 器 操作 数 , 那 么 目标 操作 数 是 
寄存 器 操作 数 的 情形 较 快 。 减 少 对 存储 器 的 访问 ,能 够 提高 执行 效率 。 

2. 避免 时 钟 数 多 的 指令 

尽量 避免 采用 时 钟 数 较 多 的 指令 ,利用 时 钟 数 少 的 指令 或 者 指令 片段 来 代替 。 

在 算术 逻辑 运算 指令 中 ,除法 指令 的 时 钟 数 最 多 ,常常 达到 几 十 个 时 钟 。 为 了 提高 执行 速 
度 ,应 该 尽量 避免 使 用 除法 指令 。 

在 例 5-18 的 函数 cf520 中 ,除数 8 是 2 的 3 次 方 ,所 以 采用 移 位 指令 代替 除法 指令 。 在 
例 5-21 的 函数 cf521 中 ,在 判断 除 以 4 的 余数 时 ,没有 用 除法 指令 ,但 在 判断 除 以 100 或 400 
的 余数 时 ,仍然 使 用 了 除法 指令 ,因为 要 求 “使 大 小 最 小 化 ”。 

【 例 5-22】 观察 3.4. 1 节 的 函数 cf320 的 目标 人 代码。 函数 cf320 的 参数 是 无 符号 整数 n， 
返回 作为 十 进 制 数 时 的 位 数 。 在 3. 4. 1 节 列 出 的 两 个 对 应 目标 代码 分 别 采用 编译 优化 选项 
“已 禁用 ”和 “使 大 小 最 小 化 ”, 现 在 采用 编译 优化 选项 “使 速度 最 大 化 ”。 

;函数 cfa20 的 目标 代码 (" 使 速度 最 大 化 " ) 

_n=8 

cf320 PROC 

push ”ebp 
mov ebp, esp 
mov ecx, DWRD PTR_n$ [ebp] ;EX 作为 参数 n 
push esi 
esi, esi ;BS1 作 为 len 
7 ;这 是 宏 指 令 ! //@# 





eax — BEPMP ;计算 m10 /i* 


42a 


ecx, edx FVI0 

inc esi ;lent+ 

test ecx, ecx inE0? 

jne ”SHORT UL3a cf320 inF 0, 继续 循环 
mv 

pop 


cf320 BP 

比较 在 3. 4. 1 节 列 出 的 同一 源 程序 的 其 他 两 个 目标 代码 ,可 见 上 述 目 标 代 码 为 了 “使 速度 
最 大 化 ?不 仅 用 寄存 器 存放 参数 ,而且 避免 了 除法 指令 。 采 用 如 下 3 条 指令 实现 n/10 的 
操作 : 


mv eax -85893 急 ;EA ccoccccdH 代表 B) 
ml ecx :乘积 在 BX:EX 中 (无 符号 乘 ) 
shr ek 3 ;相当 于 EX:E 以 整体 右 移 5 位 


尽管 执行 乘法 指令 仍然 需要 几 个 时 钟 , 但 比 除 法 指令 快 很 多 。 利 用 乘法 指令 代替 除法 指 
令 的 原理 为 : 如 果 当 被 除数 和 除数 同时 扩大 8 倍 后 ,除数 ( 约 ) 等 于 2 的 次 方 ,那么 除 操作 成 
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为 右 移 n 位。 利用 公式 表示 如 下 : 
a/b=(a*xPB/(bx*xB)=(ax*xpB)Sn 

这 里 除数 2 等 于 10,B 等 于 cccccccdH( 十 六 进 制 表示 ) ,n 等 于 35。 在 上 述 指 令 中 ,寄存 器 
EAX 存放 8, 由 于 目标 代码 由 VC 2010 编译 器 直接 生成 ,因此 十 进 制 表 示 形 式 上 是 个 负数 。 
随后 执行 的 无 符号 乘法 指令 MUL ,乘积 在 寄存 器 对 EDX:EAX 中 , 且 EDX 是 高 32 位 。 最 后 
执行 的 SHR 指令 ,虽然 右 移 3 位 ,但 把 EAX 考虑 在 内 ,相当 于 乘积 右 移 35 位 。 

利用 乘法 指令 代替 除法 指令 ,关键 是 要 找到 合适 的 B。 又 一 次 看 到 编译 器 的 “聪明 ”。 

3. 减少 转移 指令 

转移 指令 包括 条 件 转移 、 无 条 件 转 移 ,过 程 调用 和 过 程 返回 等 指令 。 由 于 转移 可 能 导致 执 
行 指令 的 流水 线 冲洗 ,也 可 能 引起 指令 高 速 缓存 未 命中 ,于 是 增加 指令 执行 时 钟 数 。 因 此 为 了 
提高 执行 效率 ,应 该 尽量 减少 转移 指令 。 在 这 方面 ,编译 器 做 得 相当 好 。 

【 例 5-23】 再 次 观察 例 5-21 函数 cf521 的 目标 代码 ,这 次 的 编译 优化 选项 采用 “使 速度 
最 大 化 ”。 

;函数 cf521 的 目标 代码 ( 采用" 使 速度 最 大 化 " ) 














_ year$ =8 
cf521 PROC 
push ebp 
mY ebp, ep 
mov ecx, DWRD PIR_ year$ [ebp] :EX 作为 参数 year 
push esi 
xor esi, esi ;BS1 作 为 变量 leap 
test cl,3 1 year %4) ==0? 
jne ”SHORT LNI@ cf521 
mov ”eax 1374389535 X year % 100) ==0? //@* 
ml ecx 
shr edx 5 ED ( year / 100) /a* 
iml edx, 100 
mov eax ecx 
sub eax edx ;ENE year- ( year/100) * 100 //@* 
jne ”SHORT LN2a cf521 : 
LNIe@ cf521: 
mov ”eax，1374389535 x year %400) ==0? /i* 
ml ecx 
shr edk 7 EX( year/400)  //f@* 
iml edk, 400 
sub ecx, edx ;EAE year— ( year/400) * 400 /fl@* 
jne SHORT UN cf521 
LN2a cf521: 
mv eax 1 ;leap=1 
po esi ;恢复 EI 
pp ep 
ret ;返回 
UN cf521: 
mov ”eax，esi ;leap=0 


pp esi ;恢复 EI 
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ret ;返回 

cf521 BNP 

从 上 述 目标 代码 可 知 ,为 了 “使 速度 最 大 化 ”, 不 仅 在 判断 (year%100) 和 (year%400) 时 ， 
类 似 例 5-22 ,利用 乘法 指令 代替 了 除法 指令 ,而 且 还 安排 了 两 处 返回 。 这 样 可 以 避免 一 次 无 
条 件 转移 。 两 条 POP 指令 和 一 条 RET 指令 ,只 需要 3 个 字 节 ,而 一 条 无 条 件 转移 指令 至 少 两 
个 字 节 。 虽 然 代 码 长 度 多 一 个 字 节 ,但 能 够 避免 一 次 转移 。 

4. 减少 循环 执行 次 数 

提高 执行 效率 的 另 一 个 举措 是 减少 循环 执行 的 次 数 。 

【 例 5-24】 再 次 观察 分 析 3. 1. 3 节 演 示 函 数 cf37 的 目标 代码 。 在 例 5-20 中 ,采用 编译 优 
化 选项 “使 大 小 最 小 化 ”。 现 在 采用 编译 优化 选项 “使 速度 最 大 化 ”。 

;函数 cf37 的 目标 代码 ( 采用 ' 使 速度 最 大 化 " ) 


_ 叶 =8 
cf37 PROC 
push ”ebp 
mv ebp, esp 
push ebx ;保护 EM 
push edi ;保护 印 | 
mov edi, DWORD PTR _n$ [ebp] ;BDI 存放 n 
xor edx, edx ;EX 作为 sml, 清 0 
xor ecx, ecx ;EX 作为 sm2, 清 0 
xor ”ebx ebx :EX 作为 ' 零头 " 
lea ”eax DWORD PTR [edx+ ;EM 作为 ii=1 
ap edi,2 ;循环 次 数 n 太 小 ? 
j SHRT LOa cf37 ;确实 太 小 , 则 转 
push esi ;保护 EI 
lea esi, DIORD PTR [edi- 了 刁 ;ESI 相当 于 (mr 1T) 
rpad 6 ;这 是 宏 指令 !  //@# 
LL10a cf37 
edx，eax ;sum+= i 
ecx DIORD PTR [ecxr eaxt ;sunDr=( i+ 1) 





eax, 2 ;= i+2 

eax, esi ii<=rr12? 
SHORT LL10a cf37 间 , 继 续 循环 
esi ;恢复 EI 


SHORT LNBa cf37 是 , 跳 转 
ebx，eax ;准备 " 零头 " 


eax，DWORD PTR [ ecxt edx| ;EAE suml+ sn? 
edi ;恢复 男 | 
eax ebx ;加 上 可 能 存在 的 " 零头 " 


add 
lea 
add 
amp 
jle 
pop 
LO98 cf37: 
ap eax, edi HE 
过 
mov 
LN88 cf37: 
lea 
pop 
add 
pop ;恢复 EX 
pop 





ret ;返回 

cf37 BP 

与 例 5-20 中 的 目标 代码 相 比 较 , 可 见 上 述 目 标 代码 稍稍 复杂 些 。 实 际 上 ,针对 循环 次 数 
确定 的 情形 ,在 目标 代码 的 循环 体内 ,重复 了 相似 的 工作 。 为 了 便于 阅读 理解 ,在 上 述 注释 中 
采用 了 suml 和 sum2 来 表示 存放 累加 之 和 的 变量 ,它们 对 应 源 程序 中 的 sum。 由 于 循环 次 数 
可 能 是 奇数 ,因此 可 能 会 出 现 * 零 头 ” 的 情况 。 

这 样 处 理 虽 然 比较 复杂 ,但 理论 上 循环 次 数 是 原先 的 一 半 ,显然 能 够 提高 执行 效率 。 编 译 
器 这 样 的 处 理 方法 ,有 时 可 供 借鉴 。 

5. 关于 内 联 函 数 

过 程 调 用 和 返回 属于 转移 ,也 比较 耗 时 。 因 此 ,在 C 语言 中 提供 了 内 联 函 数 的 调用 约定 
Cinline) 。 所 谓 内 联 函 数 就 是 源 程序 中 以 函数 的 形式 存在 ,但 目标 程序 中 直接 嵌入 。 这 样 就 避 
免 了 由 调用 指令 CALL 和 返回 指令 RET 引起 的 转移 。 

【 例 5-25】〗 设 有 如 下 内 联 函 数 cf522, 该 函数 与 前 面 的 演示 函数 cf520 功能 相同 ,但 调用 
约定 为 ”inline” 表 示 内 联 函 数 。 还 有 演示 调用 cf522 的 主 调 函 数 cf523 ,观察 函数 cf523 的 目 
标 代码 。 

// 内 联 函 数 cf522 

_inline unsigned int cf522X unsigned char nn) 

{ 

unsigned int Xx, y, sum; 
Ene; 

Fn/8.; 

SuF x+ yi; 

return sum; 

} 

/演示 函数 cf523 

int cf523 int x) 

{ 

int y; 
ycf52X x+ B) ; 
retum y; 
} 
采用 编译 优化 选项 “使 速度 最 大 化 ”, 在 编译 上 述 函 数 cf523 之 后 ,可 得 到 如 下 目标 代码 : 


;演示 函数 cf523 目标 代码 (" 使 速度 最 大 化 " ) 


_ 逆 =8 
cf523 PROC 
push ep 
mov ebp, esp 
mv al, BYTE PIR _x$ [ebp] 3 cf52X x+ HB) ; 
add al, 也 
movzx eax, al i 
mov ecx, eax ; V@ 
shr ecx 3 /a 
lea eax, DWRD PTR [ecxr eaxk 8] i 


pp ep 
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ret 

cf523 BNP 

从 上 述 目标 代码 可 知 : 

(1) 虽然 在 源 程序 中 调用 函数 cf522, 但 由 于 被 调 函 数 是 内 联 函 数 ,因此 直接 把 其 目标 代 
码 赂 入 进来 。 上 述 目 标 代码 中 注释 带 “//@” 的 行 ,与 前 面 cf520 目标 代码 的 主要 行 相 比 ,几乎 
就 是 一 样 的 。 

(2) 由 于 没有 真正 发 生 调用 ,因此 不 需要 通过 堆栈 传递 参数 ,也 不 需要 建立 堆栈 框架 。 这 
样 不 仅 节 约 了 CALL 和 RET 的 开销 ,也 节约 了 传递 参数 的 开销 。 


5.4.4 内 存 地 址 对 齐 


组 成 内 存 的 每 个 字 节 存储 单元 都 有 一 个 地 址 ; 由 两 个 字 节 构 成 的 字 存储 单元 ,其 地 址 是 
较 低 的 字 节 存储 单元 地 址 ; 由 4 个 字 节 构 成 的 双 字 存 储 单元 ,其 地 址 是 较 低 的 字 存 储 单元 地 
址 ,也 就 是 4 个 字 节 中 最 低 的 字 节 存储 单元 地 址 。 
1. 地 址 对 齐 
内 存 地 址 对 齐 是 指 访问 存储 单元 的 地 址 是 存储 单元 尺寸 ( 字 节 数 ?的 倍数 。 例 如 ,访问 某 
双 字 存储 单元 , 若 当 地 址 是 4 的 倍数 时 ,就 是 对 齐 的 。 也 可 以 认为 ,如 果 地 址 对 齐 ,那么 访问 速 
度 比 较 快 。 在 不 考虑 其 他 因素 的 情况 下 ,以 下 两 条 指令 ,第 二 条 的 执行 速度 比 第 一 条 要 快 ， 
MV ”EAX [ool3FH ;地 址 不 对 齐 
MXM EX [00001380H ;地 址 对 齐 
通常 ,为 了 简化 系统 的 设计 ,同时 提高 访问 存储 器 的 速度 ,对 存储 器 的 读 写 地 址 有 规定 。 
在 采用 IA-32 系列 CPU 的 系统 中 ,存储 器 的 读 写 地 址 必须 是 4 的 倍数 。 如 果 不 是 双 字 地 址 对 
齐 ,那么 将 自动 分 解 为 两 次 读 写 操作 ,导致 多 读 写 操作 一 次 。 上 述 第 一 条 指令 读 存 储 器 的 操作 
分 解 为 : 读 地 址 为 Lo0000137CH] 的 双 字 , 读 地 址 [00001380H] 的 双 字 ,再 形成 地 址 为 
[0000137FHJ] 的 双 字 。 内 存 地 址 对 齐 读 存 储 器 示意 图 如 图 5.4 所 示 。 






































00001384 | |00001384 

00001383 r- 一 一 00001383 

NS 00001382 ee NY 00001382 

NS 00001381 SSSSSS 00001381 

SSNNNSNSSNSSN 00001380 — RSSSSSSNN 00001380 

2 0000137F 0000137F 

| |0000137E 0000137E 

[| |0000137D 0000137D 

|0000137C [| |oooo137c 
(a) 读 [0000137F] 双 字 (b) 读 [00001380] 双 字 


图 5.4 内 存 地 址 对 齐 读 存 储 器 示意 图 


虽然 系统 能 够 自动 处 理 不 是 内 存 地 址 对 齐 的 情形 .但 毕竟 降低 执行 效率 。 为 了 提高 执行 
效率 ,高 级 语言 的 编译 器 在 安排 存储 单元 时 ,一般 会 有 所 考虑 。 

【 例 5-26】〗】 分 析 5. 1 节 例 5-3 的 函数 cf53 中 局 部 变量 的 安排 。 

函数 cf53 有 两 个 字符 型 局 部 变量 和 一 个 整 型 局 部 变量 。 从 对 应 目标 代码 可 知 ,由 于 没有 
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编译 优化 ,这 3 个 局 部 变量 被 安排 在 堆栈 中 。 为 了 地 址 对 齐 , 利 用 指令 “sub esp,， 8” 在 栈 顶 
保留 了 8 个 字 节 的 存储 单元 。 一 方面 ,从 符号 常量 声明 和 图 5. 2 可 知 ,如 果 此 前 栈 顶 是 双 字 对 
齐 , 那 么 对 这 些 局 部 变量 的 访问 都 是 地 址 对 齐 的 访问 ; 另 一 方面 ,虽然 这 3 个 局 部 变量 只 需要 
6 个 字 节 的 存储 空间 ,但 仍然 安排 了 8 个 字 节 ,就 是 为 了 保证 此 后 栈 顶 的 双 字 对 齐 。 

其 他 示例 中 ,也 有 类 似 的 处 理 。 

【 例 5-27】 分 析 5. 2 节 例 5-11 的 演示 程序 dp512 中 结构 体 成 员 的 安排 。 

在 演示 程序 dp512 中 声明 的 结构 体 类 型 如 下 所 示 : 


struct STUDENT /声明 结构 体 类 型 SUDENT 
{ 
int ”num // 整 型 ( 4 个 字 节 ) 
char name[ 全; /字符 型 数组 ( 16 个 字 节 ) 
int score; // 整 型 ( 4 个 字 节 ) 
char grade; /字符 型 ( 4 个 字 节 ) 


上 
虽然 其 成 员 name 是 含有 14 个 元 素 的 字符 数组 ,但 编译 器 为 其 准备 了 16 个 字 节 的 空间 ， 
即 增加 了 两 个 字 节 的 “ 衬 垫 ”"; 类 似 地 ,虽然 成 员 grade 也 是 字符 型 ,但 增加 了 3 个 字 节 的 “ 衬 
垫 ”"。 这 样 做 的 目的 就 是 为 了 保证 在 访问 结构 体 变量 的 成 员 时 ,能 够 做 到 地 址 对 齐 。 因 此 ,该 
类 型 的 结构 体 变 量 ,实际 将 占用 28 个 字 节 。 

当然 ,如 果 调 整 项 目 配 置 属性 中 的 结构 成 员 对 齐 子 项 ,可 以 改变 地 址 对 齐 的 设置 。 

2. 高 速 缓存 

由 于 CPU 执行 指令 的 速度 远 快 于 访问 内 存 的 速度 ,因此 在 IA-32 系列 CPU 内 部 包含 了 
高 速 缓冲 存储 器 (Cache) ,简称 片上 高 速 缓存 或 者 高 速 缓存 。 现 以 Pentium 处 理 器 为 例 进行 
简单 说 明 。 

Pentium 片上 的 数据 高 速 缓存 和 指令 高 速 缓存 的 容量 都 是 8KB, 而 且 都 采用 二 路 组 相关 
联结 构 。 每 个 超 高 速 缓存 有 128 组 ,每 组 2 行 , 每 行 32 字 节 宽 。 每 行 都 有 标记 位 相关 联 , 用 于 
记录 该 行 与 内 存 中 存储 单元 的 对 应 关系 ,反映 该 行 的 有 效 状态 。 可 以 利用 软件 和 硬件 的 方法 
控制 片上 高 速 缓存 的 工作 方式 ,也 可 以 利用 软件 和 硬件 的 方法 控制 可 被 高 速 缓存 的 内 存 区 域 。 

可 以 简单 地 认为 : 如 果 读 命中 ,那么 直接 从 片上 高 速 缓存 中 读 出 ,从 而 大 大 提高 速度 ， 如 
果 读 未 命中 ,那么 通常 会 把 该 存储 单元 所 在 行 填 人 高 速 缓存 。 如 果 写 命中 ,那么 通常 不 仅 向 高 
速 缓存 相应 单元 写 , 同 时 也 向 内 存 相 应 单元 写 ; 如 果 写 未 命中 ,那么 直接 写 人 内存 相 应 单元 ， 
不 影响 高 速 缓存 。 所 谓 高 速 缓存 命中 ,是 指 欲 访问 的 存储 单元 地 址 作为 有 效 标 记 部 分 出 现在 
高 速 缓存 中 。 

片上 指令 高 速 缓存 使 得 在 一 个 时 钟 内 可 提供 多 达 32 字 节 的 原始 代码 。 利 用 这 一 特性 ,可 
以 大 大 缩短 从 内 存 中 取 指 令 ( 或 访问 存储 器 的 ) 时 间 。 

【 例 5-28】 再 次 观察 例 3-7 中 所 列 演示 函数 cf37 的 目标 代码 和 例 3-44 中 所 列 演示 函数 
cf320 的 目标 代码 。 

这 两 个 目标 代码 都 采用 了 编译 选项 “使 速度 最 大 化 ”, 参 见 例 5-24 和 例 5-22。 从 目标 代码 
可 知 ,分 别 含有 宏 指 令 “npad 6” 和 宏 指 令 “npad 7?”。 可 以 认为 宏 指 令 就 是 用 一 个 符号 代替 
一 个 片段 。 根 据 在 文件 listing. inc 中 给 出 的 定义 ,它们 分 别 代表 的 汇编 格式 指令 如 下 所 示 , 其 
中 注释 给 出 了 机 器 码 : 
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lea ”ebx [ebx+ 00000000] 印 另 0000006 字 节 ) 
lea 。 esp，[esp+r 00000000| ;四 M2M40 m0 07 字 节 ) 

这 两 条 指令 没有 实际 操作 意义 ,其 价值 就 是 “占用 ”存储 空间 。 在 对 应 的 目标 代码 中 ,分 别 
占用 6 字 节 或 者 7 字 节 。VC 2010 编译 器 如 此 安排 的 目的 是 ,利用 它们 作为 “ 衬 执 ”, 使 得 随后 
的 指令 能 够 满足 16 字 节 的 地 址 对 齐 。 在 数据 中 ,为 了 对 齐 , 可 以 用 字 节 数据 0 作为 “ 衬 垫 ”。 
但 在 代码 中 ,必须 用 这 样 的 “ 空 " 指 令 作 为 “ 衬 垫 ”。 

函数 cf320" 使 速度 最 大 化 ”所 得 目标 代码 文件 如 下 所 示 , 其 中 第 一 列 是 相对 偏 移 , 第 二 列 
是 每 条 指令 的 机 器 码 , 第 三 列 是 汇编 格式 的 指令 : 


Wm 5 push ebp 

00001 bec mov ebp，esp 

00008 HbHB mov ecx, DNORD PTIR _n$ [ebp] 
00006 % push esi 

00007 3f6 xor esi, esi 

0000? 巴 a200000 lea esp, [esp+ 00000000] 
00010 b8 od cc cc cc LL3: mv eax, coooooocH 
00015 f7 el ml ecx 

00017 cl ea 08 shr edx 3 

000la ba mov ecx，edx 

Otc % inc esi 

0001d E59 test Ecx, ecx 

000If 万 ef jne SHORT LL3 

00021 8B co mov eax，esi 

00023 5e pop esi 

OM 5d pop ebp 

00025 c3 ret 


从 上 述 目标 文件 ,可 以 清楚 地 看 到 在 偏 移 00009 处 ,插入 了 “ 空 ”指令 作为 * 衬 垫 "。 这 样 做 
后 ,构成 循环 体 的 指令 从 16 字 节 边界 处 开始 ,可 以 有 效 地 占用 高 速 缓存 的 行 , 从 而 达到 提高 执 
行 效率 的 目的 。 


5.5 C 库 函数 分 析 


C 语言 以 库 函 数 的 形式 提供 可 以 共享 的 通用 子 程序 。 利 用 库 函 数 , 不 仅 能 够 提高 编程 工 
作 的 效率 ,而 且 往 往 也 能 够 提高 程序 运行 的 效率 。 也 可 以 认为 , 库 函 数 是 经 过 精心 设计 的 , 库 
函数 将 会 充分 发 挥 软 硬 件 系统 的 性 能 。 本 节 分 析 strlen 等 几 个 典型 库 函 数 ,一 方面 加 深 对 “ 优 
化 ”的 理解 , 男 一 方面 学 习 库 函数 的 设计 。 


5.5.1 函数 strlen 


函数 strlen 是 C 语言 字符 串 处 理 库 函 数 之 一 ,其 功能 是 测量 字符 串 长 度 。 在 3.4 节 的 
例 3-45 中 ,介绍 了 具有 相同 功能 的 函数 cf321 的 目标 代码 ,其 两 个 版 本 的 目标 代码 都 是 由 
VC 2010 编译 生成 的 ,只 是 编译 选项 不 同 。 当 时 的 重点 是 介绍 循环 结构 的 具体 实现 。 在 3. 4 
节 的 例 3-49 演示 程序 dp323 中 ,给 出 了 用 汇编 语言 编写 的 测量 字符 串 长 度 的 代码 片段 ,当时 
的 重点 是 说 明 循 环 指令 的 使 用 。 
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现在 介绍 VC 2010 自 带 的 函数 strlen 的 源 代码 , 它 由 汇编 语言 编 写 。 现 在 的 重点 是 观察 


函数 strlen 的 原型 及 其 算法 如 下 所 示 , 设 字符 串 有 结束 标记 ( 字 节 0) ,作为 函数 返回 值 的 


分 析 提 高 运行 效率 的 方法 。 
1. 函数 源 代码 
长 度 不 包括 字符 串 结束 标记 ， 
int strler( const dhar * str) 
{ 
int length= 0; 
whilg * str+) 
++ length; 
retum ( length) ; 


] 


函数 strlen 的 汇编 源 代码 如 下 所 示 。 为 了 突出 重点 ,便于 阅读 ,对 来 自 安装 文件 夹 的 


strlen. asm 进行 了 适当 简化 处 理 , 删 掉 了 其 中 的 宏 等 : 
;由 堆栈 传递 待 测字 符 串 起 始 地 址 ( 偏 移 ,由 eax 返回 字 符 串 长 度 


;ecx 指 向 字符 串 首 

;地 址 4 倍 对 齐 ? 

间 , 则 转移 

学 节 递 增 ,实现 地 址 4 倍 对 齐 


; 遇 到 结束 标记 , 则 转移 


; 仍 没 有 4 倍 对 齐 ,继续 递增 
沾 位 空 操作 ,为 了 代码 对 齐 //@# 
;要 求 16 字 节 对 齐 山 


:现在 地 址 4 倍 对 齐 
:到 4 个 字 节 


;如 果 较 低 字 节 非 0 则 会 向 上 进位 
;eaxc FFFFFFFFH 

;过 滤 出 待 测试 的 位 

;调整 指针 

浏 断 4 字 节 中 是 否 含有 全 0 的 字 节 ? 
; 否 , 继 续 循环 


;影响 寄存 器 eax、ecx、edkk 
strlen proc 
mov ecx, [esp+ 
test ecx, 3 
je short main_ loop 
str_misal igned: 
mov al, byte ptr [ecx] 
add ecx, 1 
test al, al 
je Short byte 3 
test ecx 3 
jne short str_misaligned 
add eax, dword ptr 0 
align 16 
main_ loop: 
mov eax, dword ptr [ecx] 
mov ed, 7efefeffh 
add ed, eax 
xor eax -1 
xor eax, edx 
add ecx 4 
test eax 8101010h 
je short main_loop 
mv eax [ec 本 
test al, al 
je Short byte 0 
test ah 由 
je short byte 1 


;估计 4 字 节 中 含有 全 0 的 字 节 
重新 取 刚 才 的 4 字 节 
浊 否 第 0 个 字 节 为 全 0 


浊 否 第 1 个 字 节 为 全 0 
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test eax 00ff000h 有 是 否 第 2 个 字 节 为 全 0 
je short byte 2 
test eax Off00000Dh 间 否 第 3 个 字 节 为 全 0 
je short byte 3 
jmp short main_loo ;处 理 例 外 : 位 2 30 为 0 位 3 为 1 
byte 3: 
lea eax, [ecx 了 ;eax 指 向 字符 串 尾 
mv ecx, [esp+ ;ecx 指 向 字符 串 首 
sb eax, ecx ;计算 字符 串 长 度 ( 不 含 结束 标志 ) 
ret 
byte_2: 
lea eax [ecx-2 ;eax 指 向 字符 串 尾 
mv ecx [esp+ 了 ;ecx 指 向 字符 串 首 
sub eax, ecx ;计算 字符 串 长 度 ( 不 含 结束 标志 ) 
ret 
byte_1: 
lea eax [ecocr 3 ;eax 指 向 字符 串 尾 
mv ecx [esp+ 本 ;ecx 指 向 字符 串 首 
sub eax, ecx ;计算 字符 串 长 度 ( 不 含 结束 标志 ) 
ret 
byte 0: 
lea ”eax [ecc 习 ;eax 指 向 字符 串 尾 
mv ecx [esp+ 习 ;ecx 指 向 字符 串 首 
Sb eax, ecx ;计算 字符 串 长 度 ( 不 含 结束 标志 ) 
ret 
strlen endp 


从 上 述 汇编 语言 的 源 代码 可 知 ,该 函数 的 代码 比较 元 长 。 与 函数 cf321 的 目标 代码 和 
dp323 中 以 嵌入 汇编 形式 出 现 的 代码 片段 相 比 ,都 是 如 此 。 但 它 确 实 是 经 过 精心 设计 的 ,而 且 
把 运行 效率 作为 首要 的 设计 目标 。 

2. 实现 步 又 

上 述 函 数 strlen 的 具体 实现 步骤 如 下 。 

(1) 找到 从 字符 串 起 始 位 置 开始 的 首 个 能 够 被 4 整除 的 地 址 。 换 名 话说 ,就 是 首 个 地 址 
是 双 字 对 齐 的 地 址 。 因 为 最 多 相差 3 个 字 节 ,而 且 字 符 串 可 能 很 短 , 所 以 从 首 地 址 开始 依次 逐 
字 节 判断 。 这 是 序幕 。 

(2) 每 次 4 个 字 节 ,循环 判断 是 否 遇 到 字符 串 结束 标记 。 作 为 主体 的 循环 分 两 部 分 : 一 部 
分 ,快速 推断 出 4 个 字 节 中 不 含 结束 标记 ,从 而 继续 循环 ; 另 一 部 分 ,在 极 可 能 遇 到 结束 标记 
的 情形 下 ,准确 定位 结束 标记 。 第 一 部 分 的 具体 细节 为 ,在 经 过 三 次 巧妙 的 运算 之 后 ,如 果 低 
8 位 全 为 0, 那么 高 8 位 中 的 最 低位 必定 是 1; 也 可 以 认为 ,最 高 字 节 的 8 位 由 较 低 7 位 和 最 高 
1 位 构成 ,同样 较 低 7 位 全 为 0, 那 么 最 高 位 是 1; 唯一 的 例外 是 位 24 至 位 30 为 0, 而 位 31 为 
1。 准 确定 位 结束 标记 的 代码 分 辨 5 种 情形 ,4 种 是 结束 标记 位 置 情形 ,最 后 是 上 述 例外 情形 。 
根据 4 种 结束 标记 位 置 情形 ,分 别 转 和 人 不同 的 收尾 处 理 代码 。 

(3) 计算 字符 串 的 长 度 。 字 符 串 的 长 度 是 字符 串 结束 标记 所 在 位 置 与 起 始 位置 的 差 。 对 
应 上 述 4 种 结束 标记 位 置 情形 ,有 4 有 段 很 相似 的 收尾 代码 ,它们 的 差异 仅仅 是 定位 结束 标记 的 





位 置 。 

3. 提高 运行 效率 的 方法 

上 述 函 数 strlen 采用 的 提高 运行 效率 的 方法 包括 以 下 几 方 面 。 

(1) 尽 可 能 使 得 每 次 访问 双 字 存储 单元 的 地 址 是 双 字 对 齐 的 地 址 。 上 述 “ 三 部 曲 ” 的 第 一 
部 就 是 寻找 双 字 对 齐 的 地 址 ,这 样 在 进行 主体 循环 时 ,每 次 从 存储 器 中 取 字 符 串 的 4 个 字符 
( 字 节 ) 时 ,可 以 都 是 地 址 对 齐 的 。 不 仅 如 此 ,作为 主体 的 循环 代码 片段 也 从 16 字 节 对 齐 的 地 
址 处 开始 。 在 上 述 代码 中 ,注释 带 有 ”*//@# ”标记 行 的 指令 没有 操作 意义 , 它 的 实际 作用 是 占 
用 5 个 字 节 空间 ,从 而 使 得 随后 的 指令 从 16 字 节 对 齐 的 地 址 处 开始 。 这 是 事先 经 过 准确 计算 
的 。 其 后 的 伪 指 令 “align 16” 明 确 要 求 以 16 字 节 边界 对 齐 。 

(2) 减少 循环 次 数 。 在 作为 主体 的 循环 中 ,每 次 快速 判断 4 个 字 节 。 在 有 效 减少 循环 次 
数 的 同时 ,还 有 效 精简 循环 体 。 

(3) 减少 分 支 。 在 经 过 三 次 简单 的 算术 逻辑 运算 后 , 仅 用 一 次 判断 ,就 基本 推断 出 4 个 连 
续 的 字 节 不 含 结束 标记 ,方法 很 精巧 。 安 排 4 条 返回 指令 ,从 而 实现 就 地 返回 。 

(4) 以 空间 换 时 间 。 安 排 4 段 很 相似 的 计算 字符 串 长 度 的 代码 ,对 应 4 种 结束 标记 位 置 
情形 ,这 样 就 可 以 有 效 减少 分 支 。 


5.5.2 函数 strpbrk 


函数 strpbrk 是 C 语言 的 另 一 个 字符 串 处 理 库 函数 。 其 功能 是 ,获得 在 字符 串 str 中 出 现 
的 第 一 个 来 自 于 字符 串 control 中 字符 的 地 址 偏 移 ; 或 者 说 ,指向 字符 串 str 中 的 第 一 个 属于 
字符 串 control 的 字符 的 指针 ,如 果 不 存 在 , 则 返回 空 指针 。 

1. 函数 源 程序 

函数 strpbrk 的 C 语言 原型 如 下 所 示 ( 来 自 string. h) : 

char * strpbrK const char * str，const char * oontro) 

在 VC 2010 的 安装 文件 夹 中 ,可 以 找到 函数 strpbrk 的 汇编 源 代码 文件 strspn. asm。 为 
了 便于 阅读 , 删 掉 了 其 中 的 宏和 条 件 汇编 等 ,调整 后 的 源 代码 如 下 所 示 : 

;由 堆栈 传递 字符 串 str 和 control 的 起 始 地 址 ( 偏 移 ) 

;由 eax 返 回 指向 第 一 个 出 现 字 符 的 指针 ( 可 能 空 指针 ) 

影响 寄存 器 eax、ecx、edkx 

; 设 字符 串 有 结束 标记 ( 字 节 0) 

strpbrk proc 


EBP EP ;建立 堆栈 框架 
ESI ;保护 寄存 器 


eax ;也 


济济 二 者 
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eth [ebpt 何 :取得 字符 串 oontrol 首 地 址 


mov 
lea ecx, [ecxr 0] ;align @ WordSize /人 @# 
listnext: 彻 始 化 位 图 , 按 oontrol 中 出 现 字 符 
mv al, [edx] 
or al,al ;到 字符 串 oontrol 尾 ? 
j short listdone 间 , 已 经 建立 好 位 图 
add edx 1 
bts ”DORD PTR [esp] eax 设置 位 图 中 的 对 应 位 
jm short listnext 
listdone: 
; Loop throueh omparing 
esi, [ebpt 8] ;取得 字符 串 str 的 首 地 址 
mov edi, edi ;align @ WordSize //@# 
;这 里 地 址 双 字 对 齐 
dstnext: ; 
mov al, [esi 
or al,al ;到 字符 串 str 尾 ? 
jz short dstdone 间 , 准 备 返回 
add esi,1 
bt DORD PTR [esp], eax 浏 断 位 图 中 的 对 应 位 是 否 被 标记 
jne short dstnext ;无 标记 ,未 出 现在 control 中 , 则 继续 
;至 此 ,首先 出 现 属于 control 的 字符 
lea ”eax [esi-] ;准备 返回 指针 
dstdone: 
add esp, 32 ;撤销 作为 局 部 变量 的 位 图 
POP EI 和 恢复 被 保护 的 寄存 器 
LENE 撤销 堆栈 框架 
RET 
strpbrk endp 


在 上 述 源 代 码 中 ,过 程 strpbrk 的 开始 和 结束 部 分 的 大 写 指 令 ,是 直接 添加 的 。 实 际 上 ， 
这 些 指 令 将 会 由 汇编 器 生成 。 指 令 LEAVE 的 功能 是 撤销 堆栈 框架 , 它 相当 于 “MOV ESP， 
EBP” 和 “POP EBP” 两 条 指令 。 

2. 实现 步 又 

从 上 述 汇编 源 代码 可 知 , 函 数 strpbrk 的 具体 实现 的 主要 步骤 如 下 。 

(1) 初始 化 由 32 个 字 节 构成 的 长 256 位 的 位 图 。 

(2) 标记 位 图 。 对 control 字符 串 中 出 现 的 每 个 字符 ,在 位 图 的 对 应 位 上 做 标记 。 利 用 位 
操作 指令 bst, 将 位 图 对 应 位 设置 成 1, 即 打上 标记 。 

(3) 搜索 首次 出 现 的 特定 字符 。 从 字符 串 str 的 首 字符 开始 ,依次 逐一 判断 位 图 中 对 应 的 
位 是 否 有 标记 ,直到 有 标记 字符 出 现 为 止 。 利 用 位 操作 指令 bt 检测 位 图 中 对 应 的 位 。 

3. 提高 运行 效率 的 方法 

上 述 函 数 strpbrk 采用 的 提高 运行 效率 的 方法 包括 以 下 几 方面 。 

(1) 充分 利用 IA-32 系列 CPU 的 指令 。 无 论 是 标记 位 图 还 是 检测 位 图 ,都 采用 了 位 操作 
指令 ,简洁 明了 , 既 快 又 好 。 利 用 8 条 相同 的 “push ” eax” 指令 ,初始 化 位 图 。 每 条 这 样 的 指令 
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只 有 一 个 字 节 ,同样 是 既 快 又 好 。 

(2) 通过 插入 空 操作 指令 ,保证 循环 体 开 始 指令 处 于 双 字 边界 。 见 上 述 代码 中 注释 带 
“//@#” 的 行 。 

(3) 以 空间 换 时 间 。 仍 然 采 用 位 图 的 思路 ,以 较 小 的 堆栈 空间 ,避免 了 二 重 循环 。 


5.5.3 函数 memset 


函数 memset 是 VC 2010 集成 开发 环境 使 用 的 内 部 函数 。 其 功能 是 ,快速 地 把 某 个 内 存 
区 域 的 每 个 字 节 填充 成 指定 值 。 

1. 函数 源 程序 

虽然 memset 是 内 部 函数 ,在 说 明 其 功能 时 , 仍 可 采用 如 下 所 示 的 原型 表示 ,其 中 由 dst 给 
出 目标 内 存 区 域 的 首 地 址 ,由 value 指定 设置 的 字 节 值 ,由 count 给 出 目标 内 存 区 域 的 字 节 数 : 

char * memset( char * dst, char value, unsigned int count) ; 

在 VC 2010 的 安装 文件 夹 中 ,可 以 找到 函数 memset 的 汇编 源 代码 文件 memset. asm。 为 
了 便于 阅读 , 删 掉 了 其 中 的 宏 ,整理 后 的 源 代码 如 下 所 示 : 


;由 堆栈 传递 参数 dst、value 和 count 
;由 eax 返 回 指 向 目标 区 域 的 指针 
memset proc 
mov edx, [espt Och] ;B 泊 长 度 ( 字 节 数 ) 
mv ecx [espt ;EO0E 目标 首 地 址 
test edx, edx 长 度 为 中 
jz short toend ;如 长 度 为 0, 直接 结束 
xor €ax, eax 
mv al, [espt = 填充 值 
;对 较 大 内 存 区 域 的 清 零 ,考虑 采用 SSE2 技术 
test al, al ;填充 值 是 
jne dword_align ; 否 , 则 跳 转 
ap edx (Bh ;填充 区 域 较 大 吗 ? 
jb ”dword_ align ; 否 , 则 跳 转 
ap ”DWORD PIR sse2_ available 0 ;支持 SSE2 ? 
je ”dword align : 否 , 则 跳 转 
jm _VEC marzero ;利用 SSE2 实现 ( 不 再 返回 ) 
;通过 少量 填充 ,确保 批量 填充 的 开始 地 址 为 双 字 地 址 对 齐 
dword_align: 
push edi ;保护 印 | 
mov edi, ecx ;BDI= 目标 首 地 址 
ap ek 4 长 度 小 于 4 字 节 ? 
jb tail 十 ,直接 跳 转 到 扫尾 处 理 
neg ecx ;计算 目标 首 地 址 在 对 齐 之 前 的 字 节 数 
and ecx,3 :EO 在 双 字 对 齐 之 前 的 字 节 数 
jz short dwords 沁 经 双 字 对 齐 , 则 跳 转 
sb 


edx, ecx ;EBD 稍 后 需要 批量 处 理 的 长 度 
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my [edi], al ;为 了 双 字 对 齐 , 少 量 填充 
add edi,1 
sub ecx 1 
jrz adjust_loo 
dwords: ;至 此 , 首 地 址 已 双 字 对 齐 
:使 得 电 含 4 字 节 填充 值 
mov ecx, eax ; ecc 000walue 
shl eax 8 ; eaxc 00waluem 
add eax, ecx ; eaxc Qal/Nal 
mov ecx, eax ; ecc QQNal/Nal 
shl eax, 10h ; eaxc valval/00 
add eax, ecx ; ea val/Nal/Nal/Nal 
;实施 每 次 4 字 节 的 填充 
mov ecx, edx :EOE 长 度 
ad edx 3 ;B 六 尾数 ( 4 字 节 填充 后 的 剩余 ) 
shr ecx 2 ;ECE 4 字 节 为 单位 的 长 度 
jz tail ;如 为 0, 直接 跳 转 到 扫尾 处 理 
rep stosd ;批量 填充 Ma 
main_loop_tail: 
test edx, edx ;是否 有 ' 尾巴 "? 
jz finish ;没有 ,填充 完毕 
:扫尾 工作 
tail 
mv [edi], al 每 次 扫尾 1 字 节 
ad edi,1 /a 
sb ek,1 /A 
jrz tail 
finish: 
mv eax [espt 8] ;准备 返回 值 M@# 
pp edi :恢复 保存 的 印 | 
ret 
toend: 
mv eax [espt 准备 返回 值 /@* 
ret 


memset end 

2. 提高 运行 效率 的 方法 

上 述 函 数 memset 采用 的 提供 运行 效率 的 方法 包括 以 下 几 方 面 。 

(1) 作为 内 部 函数 ,没有 建立 堆栈 框架 ,直接 根据 堆栈 指针 寄存 器 ESP 访问 堆栈 中 的 入 
口 参数 。 注 意 , 因 为 没有 压 人 EBP 寄存 器 .所 以 基于 ESP 的 相对 位 移 量 要 少 4。 

(2) 如 果 是 对 较 大 内 存 区 域 实施 清 零 ,采用 SSE2 技术 。SSE2 是 IA-32 系列 CPU 支持 的 
扩展 技术 。 

(3) 在 循环 多 次 连续 访问 内 存单 元 之 前 .调整 访问 的 存储 单元 起 始 地 址 ,从 而 保证 内 存单 
元 地 址 处 于 双 字 对 齐 。 

(4) 采用 字符 串 操 作 指 令 , 尽 可 能 每 次 填充 双 字 。 





5.6 C 程序 的 目标 代码 


本 节 以 Base64 的 编码 和 解码 为 例 , 观 察 分 析 编 码 和 解码 函数 的 目标 代码 。 在 简要 说 明 
Base64 编码 后 , 列 出 由 C 语言 编写 的 源 程序 ,分 析 在 VC 2010 环境 下 生成 的 目标 程序 。 


5.6.1 Base64 编码 操作 


Base64 属于 MIME(Multipurpose Internet Mail Extensions ,多 功能 Internet 邮件 扩充 服 
务 )。Base64 是 被 多 媒体 电子 邮件 和 WWW 超 文本 所 广泛 使 用 的 一 种 编码 标准 ,用 于 传送 诸 
如 图 形 和 声音 等 非 文 本 数据 。 它 是 现今 在 互联 网 上 应 用 最 多 的 一 种 编码 ,大 多 数 的 电子 邮件 
软件 都 把 它 作为 默认 的 二 进 制 编码 。 在 RFC1421 中 详细 定义 了 MIME。 

Base64 编码 的 基本 方法 为 : 将 输入 数据 流 每 次 取 6 位 (bit) ,用 此 6 位 的 值 (0 一 63) 作 为 
索引 , 查 Base64 编码 对 照 表 得 到 相应 的 可 显示 字符 。 因 此 ,输入 数据 流 的 每 3 个 字 节 (24 位 ) 
被 编码 成 4 个 字符 。 如 果 出 现 编码 的 结果 最 后 不 满 4 个 字符 的 情况 ,那么 用 等 于 号 “二 ”填充 。 
这 样 处 理 可 以 避免 后 面 附 加 的 信息 造成 编码 的 混乱 ,而 且 便 于 解码 ,所 以 编码 后 的 字符 串 长 度 
一 定 是 4 的 倍数 。 

用 字符 数组 形式 定义 的 Base64 编码 对 照 表 如 下 : 

const char const +* CharSet= 

{ " ABCDEFEHI J MPRSTUMAYZabodefehi klnnapor stuweyzO123456787 

3 

从 上 述 编码 对 照 表 可 知 , 它 由 26 个 大 写字 母 .26 个 小 写字 母 .10 个 数字 符 及 加 号 “十 ”和 
除 号 “/” 依 次 构成 ,合计 64 项 。 

Base64 编码 的 具体 步骤 为 : 首先 将 第 一 个 字 节 右 移 两 位 ,析出 高 6 位 ,就 得 到 第 一 个 目标 
字符 的 索引 值 , 从 Base64 编码 表 中 取得 对 应 字符 ,就 得 到 第 一 个 目标 字符 ; 其 次 将 第 一 个 字 
节 左 移 6 位 ,拼接 上 第 二 个 字 节 右 移 4 位 的 结果 , 即 获 得 第 二 个 目标 字符 的 索引 值 ; 然后 再 将 
第 二 个 字 节 左 移 4 位 ,拼接 上 第 三 个 字 节 右 移 6 位 的 结果 ,获得 第 三 个 目标 字符 的 索引 值 ; 最 
后 取 第 三 个 字 节 的 右 6 位 , 即 获得 第 四 个 目标 字符 的 索引 值 。 

图 5.5 给 出 了 对 由 A、B、1 这 3 个 字 节 数据 进行 Base64 编码 过 程 示意 图 ,为 了 便于 查看 ， 
采用 了 十 六 进 制 和 十 进 制 多 种 表示 形式 。 
































字符 A B 1 
党 ASEuS Ox41 0x42 0x31 
人 01000001 01000010 00110001 
二 3 字 节 转 4 字 节 
每 字 节 前 补 00 | 00 010000 | 00 010100 | 00001000 | oo 110001 
二 六 进 制 oxl0 | oxl4 | ox08 0x31 
十 进 制 16 | 20 | 8 49 
查 Base64 表 Q 这 I X 











图 5.5 A.、B.1 的 Base64 编码 过 程 示 意图 
解码 是 编码 的 逆 过 程 。 通 过 解码 将 4 个 字 节 的 Base64 编码 转换 为 3 个 字 节 的 数据 。 在 
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解码 过 程 中 ,通过 查找 编码 表 得 到 对 应 字符 的 索引 值 , 再 分 拆 组 合 索引 值 的 二 进 制 位 ,就 可 以 
还 原 出 数据 。 


5.6.2 源 程 序 


下 面 的 C 程序 dp524 是 一 个 简易 的 Base64 编码 和 解码 程序 。 首 先 由 用 户 选 择 编码 或 者 
解码 操作 ,然后 由 用 户 输入 数据 ,随后 进行 编码 或 者 解码 处 理 ,最 后 显示 处 理 结果 。 为 了 简化 ， 
用 户 数 据 采 用 字符 串 表 示 。 

/ 锭 示 程 序 dp524 

/演示 Basel 的 编码 和 解码 

#include < stdio.h> 

#include < string h> 

# define BIFFLEN 256 

# define SIZE 64 

//BaseM 编码 对 照 表 

const char const* (QharSet= 

{ " ABCDEFGHI J MNOPGRSTUWXYZabodefghi jk lmoparstuwocyz0123456789+ /" } ; 

/函数 声明 

int ”BasebEroodk dhar * oonst dest omst unsigned der # src int srden) ; 

int ”BasebDecodg unsigned char * const dest, const char * src) ; 

unsigned int Chr2IndeX char ch) ; 

// 主 函数 

int mair( int argc char * argv[ | ) 

{ 


char textLBUFFLEN ={ 0} ; /存放 输入 数据 
char buffLBUFFLENk 习 ; /存放 转换 结果 
char mode; /操作 方 式 
printf" Encode | Decode ? :" ) ; /由 用 户 选 择 操作 方式 
scanf" %e" , &mde) ; 
mode |= 0x20; 
if K mode='e' | | mode=='d) ) 
return 1; 
printf" Irput text:" ) ; /由 用 户 输入 数据 ( 字符 串 ) 
scanf" %s" , text) ; 
if mde= ='e') // 编 码 处 理 
BasebEncodg buff,( const unsigned char *) text，strler text) ) ; 
else 
{ /解码 处 理 
int lerF BasebDecod ( nsigned char* ) buff text) ; 
text[ len] ="\0'; // 为 了 显示 输出 ,添加 字符 串 结 束 符 


printfk" % s\n" , buff) ; 





retum 0 
A ================================================= 
功 能 : 对 指定 数据 进行 Baseb 编码 
和 人口 参数 : char * const dest 编码 结果 缓冲 区 首 地 址 
const unsigned char * src 待 编码 数据 首 地 址 
int srcden 待 编码 数据 的 长 度 
出 口 参数 : irt 编码 结果 的 字符 串 长 度 
说 。 明 : 编码 结果 缓冲 区 大 小 至 少 是 srden 的 43 倍 加 一 


int ”BasebEnood dher * oost dest, omst unsigned dhar * src, int srd en) 


{ 


unsigned char *ps=( unsigned char *) src; 

char *pd dest; 

int i=0; 

unsigned char tenmp; 

六 

/依次 编码 ( 3 个 字 节 原始 数据 ,转换 成 4 个 字符 ) 
while i < srden) 


case 0: 
*pdt+= CharSet[* ps >> 习 ; 
tap=(*pst+<< 4) & 0d3f; 
break; 

case 1: 
*pdt+= CharSet[ terp|( * ps >> 4) ]; 
tewp=(*pst+<< 2) & Ox3f; 
break; 

case 2: 
* pd++= CharSet 
* pdt+= CharSet 
break; 





让 
} 
/处 理 剩余 的 零头 部 分 ,用 ' =" 填补 结果 字符 串 不 足 
if srden %3 {=0) 
{ 

* pdt+= OharSet[tep] ; 

if srden % 3=1) 

*pdt+='="'; 

*pdt+='="; 
} 
* pd 0; /添加 结果 字符 串 的 结束 标志 
return (pd- dest) ; /返回 结果 字符 串 的 长 度 
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: 对 指定 字符 串 进行 Base4 解 码 

: unsigned char # const dest 结果 数据 缓冲 区 首 地 址 
const char * src 待 解码 字符 串 首 地 址 

:int 结果 数据 长 度 

: 解码 结果 缓冲 区 大 小 至 少 是 待 解码 长 度 的 34 


int ”BasebDecods unsigned char * const dest, const char * src) 


{ 


char 


*ps=( char *) src; 


unsigned char *pd dest; 


int 


i=0; 


unsigned char ch temp; 


int 


srcLerF strler( src) ; 


/依次 解码 ( 4 个 字符 ,转换 为 3 字 节 数据 ) 
whilg i < srden) 


{ 


i *ps=="'=) /是 否 遇 到 结束 字符 ? 
break; 
dhF Chr2IndeX * pst) ; /由 字符 得 对 应 索引 值 


case 1: 
*pdt+=templ( ch> 4 ; 
terp= ch << 4; 
break; 

case 2: 
*pd+=temp|( ch> 2) ; 
terp= 中 << 6; 
break; 

Case 3: 
*pdt+=temwp | oh; 
break; 


retum (pd dest) ; /返回 结果 数据 的 字 节 数 


: 查找 BaseM4 编 码 表 , 获得 指定 字符 的 索引 值 


入 口 参数 : dhar 中 指定 字符 
出 口 参 数 : unsigned int 索引 值 ( 序号 ) 


说 


明 : 


0 6 为 正常 序号 ,多 表示 无 效 字 符 ( 非 Baseb4 编码 表 符号 ) 
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unsigned int Chr2IndeX char ch) 
int i; 
for i=0; i< SI 正 ; i+}) 
, if dF = CharSet[ 1] ) 
break; 
} 
retum i; 
} 
从 上 述 源 程 序 可 知 , 主 函数 分 别 调用 编码 函数 Base64Encode 和 解码 函数 Base64Decode 
实现 编码 或 者 解码 功能 。 
编码 函数 Base64Encode 按照 上 述 Base64 的 编码 规则 ,实现 对 输入 数据 的 编码 。 通 常 被 
编码 的 数据 并 非 字 符 串 ,所 以 它 需 要 有 一 个 参数 表示 被 编码 数据 的 字 节 数 。 它 的 输出 则 是 由 
Base64 字符 构成 的 字符 串 ,所 以 在 最 后 添加 上 字符 串 结束 标记 0。 
解码 函数 Base64Decode 按 相反 的 步骤 实现 解码 。 它 的 输入 应 该 是 由 Base64 字符 构成 的 
字符 串 ,所 以 在 解码 函数 Base64Decode 内 测量 字符 串 长 度 。 它 的 输出 则 是 二 进 制 数据 ,不 一 
定 是 字符 串 。 在 函数 Base64Decode 内 ,还 调用 函 数 Chr2Index, 由 该 函数 查找 Base64 编码 
表 , 获 得 指定 字符 的 索引 值 。 


5.6.3 目标 程序 


下 面 观 察 对 应 函数 的 目标 程序 片段 。 在 VC 2010 集成 开发 环境 的 项 目 属 性 页 的 配置 属 
性 中 ,优化 子 项 选择 “使 速度 最 大 化 (/O2)”, 同 时 全 程序 优化 子 项 选择 “是 /GL”, 这 些 也 是 
Release( 发 行 版 ) 的 编译 选项 。 

为 了 阅读 方便 ,对 标号 和 变量 名 等 做 了 些 修饰 ,还 添加 了 注释 。 

1. 主 函 数 main 的 目标 程序 

编译 所 得 对 应 主 函 数 main 的 目标 程序 如 下 所 示 : 


_TEXT SEQENT ;表示 代码 段 _TET 开始 
_buff$ =-—772 ;变量 buff 的 开始 位 置 
_text$ =- 20 ;变量 text 的 开始 位 置 
_mode$ =—1 ;变量 mode 的 开始 位 置 
_argc$ =8 ;参数 arge 的 位 置 
_argey$ =12 ;参数 argv 的 位 置 
_main PROC ;函数 main 开始 


ebp，esp ;建立 堆栈 框架 
esp，772 在 堆栈 中 安排 局 部 变量 ( 256+ 256+ 2+ 4) 
esi ;保护 重要 的 寄存 器 


;char text[BUFFLEN]={ 0} ; 
eax, DNORD PTR _text$ [ebp+ 1 


0 
eax 


BE B83 
& 
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mv BYEPIR text$ [ebp], 0 

call _memset 

mov edi, DRDPIR imp printf 
push OFFSET str1 

call edi 

mov esi, DORDPIR __inp scanf 
lea ”ecx DWORD PIR _mode$ [ebp] 
push ecx 

push (OFFSET str2 

call esi 


mov al, BYTE PIR_mode$ [ebp] 
or al, 2 

add esp, 24 

mv BYTE PIR _mode$ [ebp], al 
al, 101 

SHORT LN3a main 

al，100 

SHORT LN3a main 


push OFFSET str3 
call edi 


lea edx DWRD PTR _text$ [ebp] 
push edx 
push OFFSET str4 
call esi 
esp, 12 


ap ”BYTE PIR _mode$ [ebp], 101 
jne SHRT UNa main 


;调用 内 部 函数 memset //@ 1 
:printf" Enoode | Decode ? :" ) ; 


学 符 串 " Encode | Decode ? :" 首 地 址 
;调用 库 函 数 printf 
;scanf"”% c”，&mode) ; 


学 符 串 " %c" 首 地 址 
;调用 库 函 数 scanf 
mode |= 000; 


;平衡 堆栈 


sif K mde=="'e' || mode=='d) ) 
:66H 


:0H 
;return 1; 


;返回 值 we 1 
:恢复 重要 的 寄存 器 
;撤销 堆栈 框架 


;返回 


;printf ”Ilrput text:”) ; 

他 符 串 ' Input text:" 首 地 址 
;调用 库 函 数 printf 

:scanf" %s" , text) ; 


;"%s" 首 地 址 
;调用 库 函 数 scanf 
平衡 堆栈 
;imode= ='e) 


;BasebEncoda buff,( const unsigned char *) text, strler( texd ) ; 


lea ”eax DWORD PIR _text$ [ebp] 
lea edx, DWORD PTR [eaxt 1] 


mov cl, BYTE PTR [eax] 


;strler( text) /@2 





inc eax 
test cl, cl 
jne SHORT UL main 
sub eax, edx :EA strler( text) 
push eax ; 压 和 人 参数 strlet text) 
lea eax, DWORD PIR _buff$ [ebp] 
push eax ; 压 和 人 参数 buff 首 地 址 
lea eax, DWORD PTR _text$ [ebp] ;寄存 器 传递 参数 text 首 地 址 Ma 3 
call BasebEncode ;调用 编码 函数 
add esp, 8 
mp SHORT LNe main 
LN2a main: ;else 


;int lerF BasebDecoda ( unsigned char* ) buff, text) ; 
lea ecx, DWORD PTR _buff$ [ebp] 


push ecx ; 压 人 参数 buff 首 地 址 
lea ecx, DWORD PTR _text$ [ebp] 桨 存 器 传递 参数 text 首 地 址 Me4 
call BasebDecode 
add esp, 4 
;text[ len]="\0'; 
mv BYTIE PTR _text$ [ebpr eax], 0 
LN main: ;printf" % s\n" , buff) ; 
lea edx, DIORD PTR _buff$ [ebp] 
push edx 
push OFFSET str5 学 符 串 %sS\n" 首 地 址 
call edi 
add esp, 8 
pp edi 
;retum 0; 
xor eax, eax ;返回 值 Wc 0 
pop esi ;恢复 重要 的 寄存 器 
my esp, ep ;撤销 堆栈 框架 
pp ep 
ret 0 ;返回 
_main BNP ;函数 main 结束 
_TET BDS ;表示 代码 段 _TET 结束 
对 照 主 函数 main 的 源 程序 ,比较 好 理解 上 述 目标 程序 。 现 对 注释 中 带 标记 //@ 的 几 处 加 
以 说 明 。 


(1) 为 了 对 作为 局 部 变量 的 缓冲 区 textLBUFFLEN] 进 行 初 始 化 ,调用 了 在 5. 5 节 介 绍 过 
的 内 部 函数 memset, 以 提高 执行 效率 。 

(2) 没有 调用 测量 字符 串 长 度 的 库 函 数 strlen, 而 是 直接 安排 一 个 循环 测量 字符 串 长 度 。 

(3) 由 于 选择 了 “全 程序 优化 ”, 因此 在 分 别 调用 编码 函数 Base64Encode 和 解码 函数 
Base64Decode 时 ,没有 完全 通过 堆栈 传递 参数 ,而 是 通过 寄存 器 传递 了 部 分 参数 。 

2. 编码 函数 Base64Encode 的 目标 程序 

编译 所 得 对 应 编码 函数 Base64Encode 的 目标 程序 如 下 所 示 : 

_TET SEVENT 
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: 


i 
SB 


esp 
DWORD PTR _dest$ [ ebp] 


R88 


bl, BYTE PTR _tenp$ [ebp] 


8 


edi，edi 
esi，eax 


DWORD PTR _srcLen$ [ ebp], edi 
LN8a BasebAEnco 


号 浊 aa 


最 


UL98 


edx, DNORD PTR [edxt edxk 了 习 
eax, edi 

eax，edx 

eax 0 
SHORT LN5a BasebEnco 

eax 

SHORT LNMa BasebEnco 

eax 

SHORT UN BasebEnco 


F858 88ads4ad 


movzx eax BYTE PTR basetab[ed] 

mv BYTE PTIR [ecx+ 1], al 

add ecx, 2 

mp ”SHORT LNI5a Baseb4Enco ;break:; 
UNMa BasebAEnco: 


;参数 dest 的 位 置 
;参数 srden 的 位 置 
;变量 tam 的 临时 位 置 
;函数 Baseb4Encode 开始 


;建立 堆栈 框架 

;EX 作为 变量 pd 

屿 将 作为 局 部 变量 tam 
;ESI 将 作为 局 部 变量 ps 
;加 1 将 作为 局 部 变量 i 
;i=0; 

;ps=( unsigned char *) src; 
hile i < srcden) 

;6 字 节 地 址 对 齐 


;switc i % 3) 
;计算 ( i %3) 


:mE(i1/3) 


EA- 1%3 

; 转 至 case 0 
; 转 至 case 1 
; 转 至 其 他 


;Case 2: 
水 pdt+= CharSet[terp |(*ps>> 6) ]; 


水 pdt+= OharSet[* pst+& Ox3f] ; 


;case 1: 





dl, BYTE PTR basetab[ edx] 
BYTE PTR [ecx], dl 


bl, BYTE PTR [esi] 

bl, 5 

bl, bl 

ecx 

bl, bl 

SHORT LN158 BasebEnco ;break; 


movzx eax, BYTE PTR [esi] 


shr 
mov 


my 
and 
inc 


shl 


eax 2 
dl，EYTE PTR basetab[ eax] 
BYTE PTR [ecx], dl 


bl, BYTE PTR [esi] 
bl, 3 

ecx 

bl, 4 


LN1I5a BasebEnco: 


inc 


esi 


UN BasebEnco: 


inc 


om 
j 


edi 


edi，DWRD PTIR _srdlen$ [ebp] 
L198 BasebAEnco 


LN82 BasebAEnco: 


mv 


mds 


eax, 1431655766 

DWORD PTR _srcL en$ [ebp] 
eax, edx 

eax 31 

eax，edx 
edx，DWORD PTR [eaxt eaxk 了 刁 
eax，DWORD PIR _srcden$ [ebp] 
eax，edx 

SHORT LN2a BasebEnco 


edx bl 
dl, BYTE PTR basetab[ edx] 
BYTE PTR [ecx], dl 


六 pdt+= CharSet[ temp |(*ps>> 4) ]; 


;tap=( *pst+<< 2) & Qx3f; 


;0000000fH 


;case 0: 
亲 pdt+= QharSet[*ps>> 2 ; 


;tanp=( 半 pst+<< 4) & 0Gf; 
;调整 rd 
;调整 ps 


和 


hil i < srcLen) 


if srlen % 3 [=0) 
;计算 ( srcuen % 3) 


;得 到 商 


;得 到 余数 

;余数 =0, 则 跳 转 

疹 数 F0 

六 pdt+= CharSet[ terp] ; 
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AaBB838833 
8 


BYTE PTR [ecxj, 0 
ebx 
ebp 
0 
BasebEncode BNP 
TEN BNDS 


;调整 rd 
iif srden %3=1) 


津 pdt+='='; 


津 pdt+='='; 


;EAE pd 
;EAE ( pd- dest) 
:恢复 重要 的 寄存 器 
水 pF0; 


;撤销 堆栈 框架 
;返回 


从 上 述 编码 函数 Base64Encode 的 目标 程序 中 可 知 , 除 了 通过 寄存 器 EAX 传递 参数 src 
外 ,还 采取 若干 提高 执行 效率 的 方法 。 在 5.4 节 中 介绍 过 相关 方法 ,它们 包括 : 利用 寄存 器 作 
为 局 部 变量 ; 采用 其 他 指令 代替 除法 指令 ; 插入 * 空 ?指令 ,使 得 循环 开始 处 地 址 对 齐 。 


3. 解码 函数 Base64Decode 的 目标 程序 


编译 所 得 对 应 编码 函数 Base64Encode 的 目标 程序 如 下 所 示 : 


mv esi, DWORD PIR _dest$ [ ebp] 
push edi 

mov ebx, ecx 

xor edi, edi 


lea edx, DWORD PTR [ecx+ 1 
L248 BasebDeco: 

mv al, BYTE PTR [ecx] 

inc ecx 

test al, al 


;变量 srden 的 位 置 
;参数 dest 的 位 置 
;变量 tem 的 临时 位 置 


;建立 堆栈 框架 
:EX 将 作为 

:EX 将 作为 

:BS1 将 作为 局 部 变量 pd 
;ps=( char *) sre; 


‘pd dest; 
问 ! 将 作为 局 部 变量 i 


;= 0; 
;srcLerF strler( src) ; 
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jne 
sub ecx, edx ;EC strler( src) 

mv DWORD PTIR _srden$ [ebp] ecx 

whilgk i< srden) 

test ecx, ecx 

jle SHORT LNZ1@ BasebDeco 

mv al, BYTE PIR _tenp$ [ebp] 
L198 BasebDeco: 

mv dl, BYTE PTR [ebx] :if *ps=='=") 

ap dl, 4 

je SHORT LN2@ BasebDeco ;break; 

;dhF Chr2IndeX * pstt) ; 

xor ecx, ecx i/6 

rpad 3 ;16 字 节 地 址 对 齐 
L152 BasebDeco: 

ap dl, BYTE PTR basetab[ ecx] 

je SHORT LN208 BasebDeco 

inc ecx 

ap ecx 0 

jl SHORT L158 BasebDeco 


LN208 BasebDeco: ;switc( 1% 4) 
mov 
and edx 3 ;计算 (1%4) 
inc 


ap edx 3 
ja SHORT LN25a BasebDeco 
jmp DNORD PTR LN266 BasebDeco[ edxk 本 转 多 路 分 支 /@7 


UNMa BasebDeco: ;case 0: 
add cl, cl ‘tap dh < 2; 
lea eax DWORD PTR [ecxr ecx] 


LN38 BasebDeco: ;case 1: 
dl, cl 六 pdt+=templ( dh> 4 ; 


dl, al 

BYTE PTR [esi], dl 
inc esi 
shl cl, 4 ;terp= ch << 4; 
mv al， cl 
jp 


LN BasebDeco: ;Case 2: 
mv dl,cl 六 pdt+=tewp |( th> 2) ; 
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mv BYTE PTR [es 站 ,dl 

inc esi 

shl cl,6 ;terp= dh < 6; 
mov al, cl 

jmp SHRT LN25a BasebDeco ;break; 


LN1@ BasebDeco: ;Case 3: 


or cl,al 冰 pdt+= tenp | dh; 
mv BYTEPTR [esij,， cl 
inc esi 
LN258 BasebDeco: 
ine edi ;it+; 
ap edi, DWORD PTR__srcLeng [ebp] while i < srden) 


jl SHORT LL98 BasebDeco 


pop edi 
mov eax, esi 
sb eax, DWORD PTR _dest$ [ebp] :ENE( pd- dest) 
pop esi 恢复 被 保护 的 寄存 器 
pop ”ebx 
mv esp, ep 
pp ep :撤销 堆栈 框架 
ret 0 ;返回 
LN26 BasebDeco: 
DD LN BasebDeco ;case0 人 口 
DD ”IN3a BasebDeco ;casel 入 口 
DD LN BasebDeco ;case2 人 口 
DD LNe BasebDeco ;case3 入口 
BasebDecode BNP 
_TEXT BNDS 


从 上 述 解码 函数 Base64Decode 的 目标 程序 中 可 知 : 

(1) 为 了 提高 执行 效率 ,没有 调用 对 应 函数 Chr2Index 的 目标 程序 ,而 是 直接 内 骨 了 对 应 
的 目标 程序 。 

(2) 利用 地 址 表 实 现 多 路 分 支 的 转移 。 

4. 函数 Chr2Index 的 目标 程序 

编译 所 得 对 应 函数 Chr2Index 的 目标 程序 如 下 所 示 : 

_TEXT SENMENT 

Chr2Index PROC 

xor eax, eax Hb 

L482 Chr2Index: 
cl, BYTE PTR basetab[ eax| iif dF = CharSet[ i ) 
SHORT LN8a Chr2lndex 
cl, BYTE PTR basetab| eaxr 1]| 
SHORT LNI0a Ohr2Index 
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cl, BYTE PTR basetab| eax+ 习 
SHORT LNI1@ Chr2Index 
cl, BYTE PTR basetab| eaxt 3] 
SHORT LN128 Chr2Index 
eax, 4 ;for i=0; i < SIZE; i+}) 
eax 二 
SHORT LL4a Chr2Index 
ret 0 
LN108 Chr2Index: 
inc eax 
ret 0 
LN11@ Chr2Index: 
add eax, 2 
ret 0 
LN128 Chr2Index: 
add eax, 3 
LN82 Ohr2Index: 
ret 0 


Ev 


Vis 


虽然 在 最 终 的 目标 程序 中 该 函数 没有 被 调用 ,但 是 其 自身 目标 代码 仍然 被 优化 产生 。 从 
上 述 目标 代码 可 知 : 

(1) 通过 寄存 器 传递 入 口 参 数 ,在 CL 中 含 待 确定 索引 值 的 字符 。 

(2) 由 于 是 循环 次 数 确定 的 简单 循环 ,因此 通过 重复 循环 体 的 方式 ,减少 循环 次 数 。 

(3) 为 了 减少 执行 转移 指令 ,所 以 采用 了 空间 换 时 间 的 方法 ,安排 了 4 个 出 口 。 


习 题 


1. 编写 一 个 C 程序 ,由 用 户 输 入 一 个 十 进 制 整数 ,统计 其 各 位 中 7 出 现 的 次 数 ,并 输出 统 
计 结 果 。 采 用 一 个 子 程序 进行 统计 。 根 据 5. 1. 1 节 说 明 的 VC 2010 的 编译 配置 选项 ,生成 对 
应 汇编 语言 形式 的 目标 代码 ,观察 分 析 主 函数 main 和 子 程 序 对 应 的 目标 代码 。 

2. 编写 一 个 C 程序 ,由 用 户 输 入 一 个 字符 串 ,统计 其 中 数字 符 和 英文 字母 出 现 的 个 数 ,并 
输出 统计 结果 。 采 用 一 个 子 程序 进行 统计 ,分 别 采用 子 程序 判断 数字 符 和 英文 字母 。 根 据 
5.1.1 节 说 明 的 VC 2010 的 编译 配置 选项 ,生成 对 应 汇编 语言 形式 的 目标 代码 ,观察 分 析 主 函 
数 main 和 3 个 子 程序 对 应 的 目标 代码 。 

3. 修改 演示 函数 cf59: 第 一 个 形式 参数 为 二 维 数组 ,函数 体 中 采用 访问 二 维 数组 元 素 的 
方式 实现 同样 的 功能 。 观 察 分 析 对 应 的 目标 代码 。 

4. 调整 演示 程序 dp512 中 结构 体 类 型 STUDENT 中 成 员 grade 的 位 置 ,观察 分 析 调整 成 
员 位 置 对 结构 体 变 量 尺 寸 的 影响 。 

5. 改变 函数 cf520 的 参数 类 型 为 整 型 ,观察 分 析 对 应 的 目标 代码 。 

6. 在 函数 cf521 的 目标 代码 中 ,并 没有 采用 PUSH 和 POP 指令 结合 的 方法 给 寄存 器 ESI 
赋值 400 ,为 什么 ? 

7. 请 比较 分 析 采 用 内 联 函 数 的 优 缺 点 。 
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8. 如 果 C 函数 采用 调用 约定 _fastcall, 那 么 对 应 目标 代码 会 尽量 利用 寄存 器 传递 参数 。 
请 观察 分 析 这 样 的 目标 代码 。 

9. 请 调整 编译 优化 选项 ,观察 分 析 习 题 1 和 2 的 C 程序 函数 的 目标 代码 。 

10. 请 调整 编译 优化 选项 ,观察 分 析 本 章 相关 示例 的 目标 代码 。 

11. 观察 分 析 第 2 章 的 演示 程序 dp21 的 目标 代码 ,注意 main 函数 的 两 个 局 部 变量 的 所 
在 及 相关 寻 址 方式 。 

12. 观察 分 析 第 2 章 的 演示 程序 dp29 和 dp210 的 目标 代码 ,注意 全 局 变量 和 局 部 变量 的 
所 在 及 相关 寻 址 方式 。 

13. 观察 分 析 第 3 章 的 演示 程序 dp32 的 目标 代码 。 

14. 观察 分 析 第 3 章 的 演示 程序 dp338 的 目标 代码 。 

15. 观察 分 析 第 4 章 的 演示 程序 dp41 的 目标 代码 ,注意 局 部 变量 的 所 在 及 相关 寻 址 
广 武 : 





汇编 语言 


利用 汇编 语言 ,直接 可 以 编写 源 程序 。 基 于 汇编 器 NASM, 本 章 介 绍 汇编 语言 。 在 补充 
说 明 实 方式 的 基本 执行 环境 之 后 ,介绍 汇编 语言 相关 概念 ,包括 表达 式 .指令 语句 \ 伪 指令 语句 
和 宏 指 令 语 句 等 。 

本 章 的 示例 程序 ,在 经 过 汇编 器 NASM 汇编 处 理 后 ,可 以 直接 生成 COM 类 型 可 执行 程 
序 ,或 者 生成 目标 文件 ,后 者 还 需要 经 过 链接 器 LINK 链接 处 理 后 生成 为 EXE 类 型 可 执行 程 
序 。 在 Windows(32 位 版 本 ) 的 控制 台 窗口 中 ,可 以 运行 由 本 章 示例 程序 生成 的 可 执行 程序 。 

本 章 的 示例 ,请 不 要 在 VC 环境 中 采用 艇 入 汇编 的 方式 验证 。 


6.1 实 方式 执行 环境 


实 方式 是 实地 址 方式 的 简称 ,是 最 初 的 工作 方式 。 实 方式 既是 IA-32 系列 CPU 加 电 之 后 
的 工作 方式 ,又 是 处 理 器 保持 兼容 的 工作 方式 。 本 节 说 明 实 方式 的 执行 环境 ,重点 是 实 方式 下 
存储 器 管理 的 特点 。 


6.1.1 寄存 器 和 指令 


在 实 方式 下 ,以 16 位 操作 为 主 ,以 32 位 操作 为 辅 。 客 观 上 , 实 方式 不 是 IA-32 系列 CPU 
的 常态 工作 方式 。 

1. 寄存 器 

当然 可 以 使 用 8 个 16 位 通用 寄存 器 AX、BX、CX、DX、SP、BP、SI 和 DI, 还 可 以 使 用 对 应 
扩展 后 的 32 位 寄存 器 EAX、EBX、ECX、EDX、ESP、EBP、ESI 和 EDI。 

可 以 使 用 段 寄存 器 CS.DS、SS 和 ES, 还 可 以 使 用 段 寄存 器 FS 和 GS。 寄 存 器 CS 含有 当 
前 代码 段 的 段 值 ,寄存 器 DS 含有 当前 数据 段 的 段 值 ,寄存 器 SS 含有 当前 堆栈 段 的 段 值 。 

实 方式 下 EIP 中 的 高 16 位 必须 是 0, 相 当 于 只 有 低 16 位 的 IP 起 作用 。 

实 方式 下 ESP 中 的 高 16 位 必须 是 0, 相 当 于 只 有 低 16 位 的 SP 起 作用 。 

实 方式 下 只 使 用 标志 寄存 器 中 低 16 位 的 各 类 标志 。 从 图 2. 3 可 知 ,进位 标志 CF 等 6 个 
反映 运算 结果 的 状态 标志 ,以 及 控制 字符 串 操 作 方 向 的 控制 标志 DF ,都 出 现在 标志 寄存 器 的 
低 16 位 。 

2. 指令 集 

实 方式 下 可 以 使 用 在 前 面 几 童 中 介绍 的 指令 , 现 分 组 归纳 如 下 。 

(1) 数据 传送 指令 组 。 数 据 传送 指令 组 包括 普通 传送 指令 、 堆 栈 操 作 指 令 和 数据 扩展 指 

@ 普通 传送 指令 MOV。 利 用 MOYV 指令 可 以 实现 通用 寄存 器 之 间 的 数据 传送 ; 也 可 以 
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实现 存储 器 与 通用 寄存 器 或 段 寄 存 器 之 间 的 数据 传送 ; 还 可 以 把 立即 数 送 到 通用 寄存 器 。 

@ 交换 指令 XCHG。 利 用 交换 指令 可 以 实现 通用 寄存 器 之 间 的 数据 交换 ,也 可 以 实现 通 
用 寄存 器 与 存储 器 之 间 的 数据 交换 。 

@ 进 栈 和 出 栈 指令 PUSH 和 POP; 还 有 16 位 通用 寄存 器 全 进 栈 和 全 出 栈 指令 PUSHA 
和 POPA; 还 有 32 位 通用 寄存 器 全 进 栈 和 全 出 栈 指 令 PUSHAD 和 POPAD。 

@ 符号 扩展 指令 CBW、CWD、CDQ 和 CWDE。 利 用 这 些 指令 ,可 以 分 别 把 寄存 器 AL 中 
的 值 符号 扩展 到 AX, 把 AX 中 的 值 符号 扩展 到 DX:AX, 把 EAX 中 的 值 符号 扩展 到 EDX: 
EAX, 还 可 以 把 AX 中 的 值 符号 扩展 到 EAX。 

@ 扩展 传送 指令 MOVSX 和 MOVZX。 前 者 是 符号 扩展 传送 ,后 者 是 零 扩 展 传送 。 

(2) 算术 运算 指令 组 。 算术 运 算 指令 组 包括 加 \ 减 、 乘 和 除 等 算术 运算 指令 。 运 算 对 象 是 
整数 ,尺寸 可 以 是 字 节 (8 位 )、 字 (16 位 ) 或 双 字 (32 位 ), 可 以 来 自 于 通用 寄存 器 或 者 存储 器 。 

Q@ 加 运算 指令 ADD 和 ADC。 后 者 是 带 进位 加 。 

@ 减 运算 指令 SUB 和 SBB。 后 者 是 带 借 位 (进位 ) 减 。 

@ 乘 运算 指令 MUL 和 IMUL。 前 者 是 无 符号 乘 , 后 者 是 有 符号 乘 。 

@ 除 运算 指令 DIV 和 IDIV。 前 者 是 无 符号 除 , 后 者 是 有 符号 除 。 

@ 加 1 和 减 1 运算 指令 ,分 别 是 INC 和 DEC。 

@ 取 负 数 指令 NEG 和 比较 指令 CMP。 

(3) 迎 辑 运算 指令 组 。 人 逻辑 运算 指令 组 包括 “与 “或 “ 异 或 "和 “ 否 ” 等 逻辑 运算 指令 。 运 
算 对 象 的 尺寸 可 以 是 字 节 , 字 或 双 字 ,可 以 来 自 于 通用 寄存 器 或 者 存储 器 。 

Q@ 逻辑 与 运算 指令 AND。 

@ 逻辑 或 运算 指令 OR。 

@ 逻辑 异 或 运算 指令 XOR。 

@ 逮 辑 否 运算 指令 NOT。 

@ 按 位 测试 指令 TEST。 

(4) 移 位 指令 组 。 移 位 指令 组 包括 移 位 和 循环 移 位 指令 ,分 为 左 移 和 右 移 。 移 位 对 象 可 
以 是 字 节 、 字 或 者 双 字 ,移动 的 位 数 可 以 是 一 位 ,也 可 以 是 多 位 。 

Q@ 算术 右 移 指令 SAR ,逻辑 右 移 指令 SHR, 算 术 或 逻辑 左 移 指令 SAL/SHL。 

@ 循环 右 移 指令 ROR ,循环 左 移 指 令 ROL。 

@ 带 进位 右 移 指令 RCR , 带 进 位 左 移 指令 RCL。 

@ 双 精 度 左 移 指令 SHLD 和 双 精 度 右 移 指令 SHRD。 

(5) 转移 指令 组 。 转移 指令 组 包括 条 件 转 移 指令 Jcc、 无 条 件 转移 指令 JMP、 循 环 指 令 
LOOP、 过 程 调用 指令 CALL 和 过 程 返 回 指令 RET, 还 包括 尚未 介绍 的 软 中 断 指令 和 中 断 返 
回 指令 。 条 件 转移 指令 助 记 符 中 的 cc 表示 各 种 条 件 。 

(6) 字符 串 操 作 指 令 组 。 字 符 串 操作 指令 组 包括 装 入 、 存 储 、 传 送 、 扫 描 、 比 较 等 五 类 ,每 
一 类 的 操作 对 象 (字符 ) 可 以 是 字 节 、 字 或 者 双 字 。 

Q@ 装 和 字符 指令 LODSB、LODSW 和 LODSW。 

@ 存储 字符 指令 STOSB、STOSW 和 STOSD。 

@ 传送 字符 指令 MOVSB、MOVSW 和 MOVSD。 

@ 扫描 字符 指令 SCASB、SCASW 和 SCASD。 

@@ 比较 字符 指令 CMPSB、CMPSW 和 CMPSD。 
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为 了 便于 字符 串 操作 ,上 述 字符 串 操作 指令 还 可 以 带 相 应 的 重复 前 缀 REP、REPE/REPZ 
和 REPNE/REPNZ. 

(7) 位 操作 指令 组 。 位 操作 指令 组 包括 位 测试 指令 BT 位 测试 及 复位 指令 BTR. 位 测试 
及 置 位 指令 BTS 和 位 测试 及 取 反 指令 BTC, 以 及 位 正 向 扫描 指令 BSF 和 位 反 向 扫描 指 
令 BSR。 

(8) 条 件 设置 字 节 指令 组 。 条 件 设置 字 节 指令 组 包括 16 条 根据 各 种 条 件 设置 字 节 值 的 
指令 SETcc, 指 令 助 记 符 中 的 cc 表示 各 种 条 件 。 

(9) 其 他 指令 。 除 了 上 述 指令 外 ,还 有 以 下 一 些 指 令 。 

@ 取 有 效 地 址 指令 LEA。 

@ 设置 进位 标志 指令 STC、 清 进位 标志 指令 CLC 和 取 反 进位 标志 指令 CMC。 

@ 设置 方向 标志 指令 STD、 清 方向 标志 指令 CLD。 

@ 获取 状态 标志 操作 指令 LAHF 和 设置 状态 标志 操作 指令 SAHF。 

(10) 说 明 。 上 述 这 些 指令 在 第 2 章 、 第 3 章 和 第 4 章 中 分 别 进行 过 介绍 。 此 外 ,在 实 方 
式 下 还 有 其 他 一 些 指令 也 可 以 使 用 。 总 之 ,大 部 分 指令 在 实 方式 下 都 可 以 使 用 。 随 着 IA-32 
系列 CPU 升级 换代 ,陆续 添加 了 一 些 指 令 , 或 者 增强 了 指令 的 功能 。 如 果 需 要 严格 保证 向 低 
端的 兼容 ,那么 会 有 一 些 限 制 , 当 有 这 种 需求 时 ,请 查阅 Intel 的 相关 技术 文档 。 


6.1.2 存储 器 分 段 管理 


IA-32 系列 CPU 支持 以 分 段 方式 管理 存储 器 ,在 2.4 节 中 介绍 了 相关 的 概念 。 可 以 把 线 
性 的 地 址 空间 划分 为 若干 逻辑 段 ,对 应 的 存储 空间 被 划分 为 若干 存储 段 。 
1. 存储器 分 段 条 件 
虽然 IA-32 系列 CPU 的 物理 地 址 空间 规模 达到 4GB 或 64GB, 但 是 在 实地 址 方式 下 可 访 
问 的 物理 地 址 空间 的 范围 仅 为 00000H~FFFFFH, 只 有 1MB。 
在 根据 需要 把 1MB 地 址 空间 划分 成 若干 逻辑 段 时 ,在 实地 址 方式 下 每 个 逻辑 段 必须 满足 
以 下 两 个 条 件 。 
(1) 逻辑 段 的 起 始 地 址 必须 是 16 的 倍数 。 
(2) 逻辑 段 的 最 大 长 度 为 64KB。 
实际 上 ,最初 的 Intel 8086 处 理 器 是 16 位 的 ,这 两 个 条 件 是 为 了 方便 地 计算 1MB 空间 中 
的 20 位 地 址 。 
这 些 存储 段 既 可 以 相连 ,也 可 以 重 又 。 
2. 物理 地 址 计算 
在 实地 址 方式 下 ,物理 地 址 是 20 位 , 段 起 始 地 址 是 20 位 , 偏 移 是 16 位 。 由 于 段 最 大 长 度 
是 64KB, 因 此 偏 移 只 需要 16 位 就 足以 表示 。 
在 实地 址 方式 下 ,由 于 段 的 起 始 地 址 必须 是 16 的 倍数 ,因此 段 起 始 地 址 有 如 下 形式 ， 
bbbbbbbbbbbbbbbb0000 
采用 十 六 进 制 可 表示 成 XXXX0。 这 种 20 位 的 段 起 始 地 址 ,可 压缩 表示 成 16 位 的 XXXX 
形式 。 把 20 位 段 起 始 地 址 的 高 16 位 XXXX 称 为 段 值 。 段 起 始 地 址 与 段 值 的 关系 如 下 : 
段 起 始 地 址 一段 值 X16 
于 是 ,物理 地 址 、 段 值 和 偏 移 之 间 有 如 下 关系 : 
物理 地 址 == 段 值 X16 十 偏 移 
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在 实地 址 方式 下 ,逻辑 地 址 到 物理 地 址 的 转换 过 程 如 图 6. 1 所 示 。 由 段 值得 到 20 位 的 段 
起 始 地 址 ,再 加 上 最 大 值 不 超过 16 位 的 偏 移 ,得 到 20 位 的 物理 地 址 。 事 实 上 ,将 16 位 的 段 值 
左 移 4 位 (也 就 是 乘 以 16) 便 可 得 20 位 的 段 起 始 地址 。 

















19 4 3 0 
16 位 段 值 0000 | 起 始 地 址 
19 16 15 4 3 0 
0000 16 位 偏 移 段 内 偏 移 
19 0 一 
20 位 物理 地 址 物理 地 址 











6.1 实地 址 方式 下 物理 地 址 的 计算 示意 图 


3. 逻辑 地 址 表示 

在 实地 址 方式 下 ,存储 单元 的 逻辑 地 址 由 段 值 和 偏 移 两 部 分 表示 。 其 中 ,第 一 维 是 段 值 ， 
指出 某 段 ,第 二 维 是 偏 移 , 也 就 是 有 效 地 址 ,指出 段 内 的 某 单 元 。 逻 辑 地 址 的 一 般 表示 形式 
如 下 : 

段 值 : 偏 移 

在 2.4 节 中 曾经 指出 ,在 实地 址 方式 下 , 巡 辑 地 址 中 的 段 号 是 段 值 。 

【 例 6-1】 一 些 存储 单元 的 逻辑 地 址 和 对 应 的 物理 地 址 如 下 所 示 ,左边 是 逻辑 地 址 ,右边 
是 对 应 的 物理 地 址 , 均 采 用 十 六 进 制 表示 。 


1234:3456 15796 
1234:34A8 157E8 
FFFO0:0000 FFF00 


由 于 人 逻辑 段 可 以 重生 ,因此 一 个 物理 地 址 可 对 应 多 个 逻辑 地 址 。 

【 例 6-2】 如 图 6. 2 所 示 ,给 定 的 存储 单元 的 物理 地 址 是 12345H, 标 出 的 两 个 重 释 段 的 
段 值 分 别 是 1002H 和 1233H。 该 存储 单元 在 这 两 个 段 内 的 偏 移 ( 有 效 地 址 ) 分 别 是 2325H 和 
0015H。 因 此 逻辑 地 址 1002:2325H 和 1233:0015H 都 指示 这 个 存储 单元 。 














图 6.2 一 个 物理 地 址 可 以 对 应 多 个 逻辑 地 址 


4. 段 寄存 器 引用 

在 实地 址 方式 下 , 段 寄 存 器 中 的 内 容 是 段 值 。 代 码 段 寄 存 器 CS 给 出 当前 代码 段 的 段 值 ， 
堆栈 段 寄存 器 SS 给 出 当前 堆栈 段 的 段 值 ,数据 段 寄 存 器 DS 给 出 当前 默认 数据 段 的 段 值 。 附 
加 段 寄 存 器 ES、FS、GS 也 可 以 给 出 其 他 数据 段 的 段 值 。 每 当 需 要 产生 一 个 20 位 的 物理 地 址 
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时 ,CPU 会 自动 引用 一 个 段 寄存 器 获得 段 值 ,形成 20 位 的 段 起 始 地 址 ,再 加 上 有 效 地 址 
( 偏 移 ) 。 

【 例 6-3】 在 实地 址 方式 下 , 某 个 有 段 的 段 值 为 F000H , 现 要 把 段 内 最 低 的 8 个 字 节 的 内 容 
送 到 两 个 32 位 的 通用 寄存 器 (EAX 和 EDX) 中 。 

如 下 代码 片段 实现 这 一 要 求 : 


MV AX Oro ;十 六 进 制 常数 

MV DS, AX :使 区 指向 指定 的 段 ( 段 值 为 POH) 
MW Esl,0 半 BI 为 《 段 内 最 低地 址 的 偏 移 为 0) 
MV EAX [ES ;取出 最 低 的 4 个 字 节 

MV EDX [ESI+ 本 再 取出 次 低 的 4 个 字 节 


在 执行 指令 “MOV EAX.,[ESI]” 时 ,自动 引用 数据 段 寄 存 器 DS 中 的 段 值 ,由 ESI 给 出 
的 有 效 地 址 为 0, 所 访问 存储 单元 的 逻辑 地 址 为 F000:0000H ,物理 地 址 为 F0000H。 同 样 ,在 
执行 “MOV EDX,[ESI 二 4J” 时 ,自动 以 DS 寄存 器 为 段 值 ,访问 的 存储 单元 的 迎 辑 地 址 为 
F000 :0004 于 ,物理 地 址 为 F0004H。 

【 例 6-4】 在 实地 址 方式 下 . 现 要 求 把 位 于 F000H 段 开始 处 的 32 个 字 节 的 数据 复制 到 开 
始 地 址 为 B800:2000H 的 区 域 。 由 于 是 实地 址 方式 ,因此 F000H 和 B800H 都 是 段 值 。 

如 下 代码 片段 实现 这 一 要 求 : 


MV AX OOoH ;对 应 源 段 的 段 值 

WW Ds 人 使 8 含 源 数据 段 的 段 值 

MV AX (B00H ;对 应 目标 段 的 段 值 

WwW ES 以 疾 臣 含 目标 数据 段 的 段 值 

WW Esl,0 ;ESI=0 

MX El, ZoH ;DI= 2000H 

MV EX8 ;ECE 8, 作为 循环 计数 

NEXT: 

MV EX [ESD ;从 源 数据 段 中 取 4 个 字 节 到 EMX 
;自动 引用 叹 , 偏 移 为 BI 值 

WW [ES:mU, EX ;把 EX 中 的 4 个 字 节 送 到 目标 段 
地 | 用 段 寄 存 器 ES, 偏 移 为 钙 | 值 

AD Esl,4 ;调整 EI1, 指向 源 段 下 个 双 字 存储 单元 

AD El, 4 ;调整 印 1, 指向 目标 段 下 个 双 字 存储 单元 

LOOP NET ;控制 循环 


在 上 述 代 码 片段 中 ,采用 了 一 个 循环 ,复制 数据 块 。 在 循环 开始 之 前 ,使 得 DS 含有 源 数 
据 段 的 段 值 F000H ,也 就 是 源 数据 段 成 为 当前 数据 段 ,还 使 得 ESI 指向 数据 块 起 始 位 置 。 同 
时 ,使 得 ES 含有 目标 数据 段 的 段 值 B800H ,还 使 得 EDI 指向 目标 处 。 

每 次 复制 4 个 字 节 。 指 令 “MOV EAX,[ESI]” 从 源 数 据 段 取出 4 个 字 节 到 EAX ,在 确 
定 存储 单元 物理 地 址 时 ,自动 引用 DS 获得 段 值 。 指 令 *MOV [ES:EDI],EAX” 把 刚 取出 的 
4 个 字 节 送 到 目标 数据 段 ,在 确定 存储 单元 物理 地 址 时 ,引用 附加 段 寄 存 器 ES 获得 段 值 。 在 
指令 中 采用 显 式 的 方式 指定 访问 存储 单元 时 引用 的 段 寄存 器 。 如 果 省 略 掉 其 中 的 “ES:”, 那 
么 就 变 为 指令 “MOV [EDI],EAX”, 这 样 就 会 自动 引用 DS, 达 不 到 预期 的 效果 。 

图 6. 3 给 出 了 复制 开始 4 个 字 节 数据 时 的 示意 图 ,为 了 简化 ,每 个 格子 含 4 个 字 节 。 
利用 字符 串 操 作 指 令 MOVSD 实现 例 6-4 的 功能 ,效率 会 更 高 。 
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ESI=0000 
0 ood |ec68B10 De Eo 
~ 

66TC6186T10 

EAX |! 

SEE 》| 66C68B10 
BA000 = 
1 EDI=2000 
B8000 一 一 ES=B800 








6.3 例 6-4 中 复制 4 个 字 节 数据 的 示意 图 


当 需 要 同时 访问 多 个 数据 段 时 ,利用 附加 段 寄存 器 可 以 避免 频繁 切换 当前 数据 段 寄存 器 
DS 的 内 容 , 从 而 大 大 提高 效率 。 因 此 ,从 Intel 80386 开始 增加 了 两 个 附加 段 寄存 器 FS 和 
GS, 这 样 可 以 方便 地 实现 同时 访问 4 个 数据 段 。 

除了 字符 串 操作 时 目的 段 会 自动 采用 附件 段 寄 存 器 ES 之 外 ,对 3 个 附加 段 寄存 器 ES、 
FS 和 GS 的 引用 必须 采用 显 式 的 方式 。 所 谓 显 式 的 方式 ,是 指 在 指令 中 直接 标明 段 寄 存 器 。 
这 个 直接 标明 的 段 寄 存 器 称 为 段 超越 前 级 ,超越 的 对 象 是 默认 引用 的 段 寄存 器 。 

在 访问 一 般 存储 器 操作 数 时 ,可 以 采用 段 超越 前 级 的 方式 ,指定 引用 的 段 寄存 器 ,从 而 不 
再 引用 段 寄存 器 DS。 不 仅 可 以 指定 3 个 附加 段 寄存 器 ES、FS 和 GS, 而 且 可 以 是 代码 段 寄 存 
器 CS 和 堆栈 段 寄存 器 SS。 

【 例 6-5】 如 下 指令 片段 演示 段 超越 前 级 的 使 用 ,其 中 注释 给 出 了 确定 所 访问 存储 单元 
物理 地 址 的 方法 。 


MV EAX [FS:1000H] ;物理 地 址 =FSk 16+ 1000H 
MV [65:U], DX 物理 地 址 = GS* 16+ 日 | 
MV DX [CS:ES] ;物理 地 址 = CSk 16+ ESI 
MV AL [LSS:ESU ;物理 地 址 =Ssk 16+ ESI 


如 果 有 段 超越 前 级 为 CS, 那 就 意味 着 把 代码 段 的 内 容 作 为 数据 来 访问 ,这 种 情况 是 较 少 发 
生 的 。 虽然 段 超越 前 缀 可 以 是 SS, 但 一 般 不 通过 这 种 方式 直接 访问 堆栈 的 内 容 。 因 为 常常 需 
要 直接 访问 堆栈 的 内 容 , 所 以 IA-32 系列 CPU 规定 , 当 确定 存储 单元 有 效 地 址 时 ,如果 寄存 器 
EBP 或 者 BP 作为 基 址 寄存 器 时 ,而 且 又 没有 段 超越 前 级 , 则 自动 引用 SS, 而 非 DS, 在 2.5.2 
节 中 也 有 说 明 。 


6.1.3 16 位 的 存储 器 寻 址 方式 


在 2.5.2 节 中 介绍 了 存储 器 寻 址 方式 ,IA-32 系列 CPU 提供 了 灵活 多 样 的 32 位 的 存储 
器 寻 址 方式 。 

为 了 保持 与 早先 处 理 器 的 兼容 ,IA-32 系列 CPU 还 支持 16 位 的 存储 器 寻 址 方式 ,也 就 是 
给 出 16 位 的 存储 单元 有 效 地 址 或 16 位 的 偏 移 。16 位 的 存储 器 寻 址 方式 主要 应 用 于 实 方式 。 
在 实 方式 下 ,存储 段 的 长 度 不 超过 64KB., 存 储 单元 的 有 效 地 址 是 16 位 。 

图 6.4 给 出 了 16 位 有 效 地 址 EA 的 各 种 可 能 的 表示 形式 。 其 中 , 基 址 部 分 可 以 是 寄存 器 
BX 或 BP; 变 址 部 分 可 以 是 寄存 器 SI 或 DI; 位 移 量 采用 补 码 形式 表示 ,在 计算 有 效 地 址 时 ， 
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如 位 移 量 是 8 位 , 则 被 带 符号 扩展 成 16 位 。 

在 图 6.4 所 示 的 16 位 有 效 地 址 表示 形式 中 , 基 址 、 变 址 和 位 移 量 3 个 部 分 ,可 以 缺 省 任何 
分 。 如 果 去 掉 基 址 部 分 或 者 变 址 部 分 , 则 退化 为 寄存 器 相对 寻 址 方式 。 如 果 同 时 去 掉 基 
址 部 分 和 变 址 部 分 , 则 退化 为 直接 寻 址 方式 。 如 果 只 保留 基 址 部 分 或 者 变 址 部 分 , 则 退化 为 寄 
存 器 间接 寻 址 方式 。 


避 


| 
| 
| 
| 





基 址 ” 变 址 ”位 移 量 


Bx| [si 8 位 
EA= | Bp |+ | pl |+ | 16 位 
图 6.4 16 位 有 效 地 址 ( 偏 移 ) 的 计算 式 


在 使 用 16 位 的 存储 器 寻 址 方式 时 ,如 果 寄 存 器 BP 作为 有 效 地 址 的 一 部 分 , 则 默认 引用 
的 段 寄存 器 是 SS。 
【 例 6-6】 如 下 指令 演示 16 位 存储 器 寻 址 方式 的 使 用 。 


MV [po0,&X ;目的 操作 数 有 效 地 址 是 D1 值 
AD DL [sit 10H] 源 操作 数 有 效 地 址 是 SI 值 加 10H 
SB CX [BXrDI- ; 源 操作 数 有 效 地 址 是 惟 值 加 D1 值 青 减 4 
MV [BX Si+ 123H , AL ;目的 操作 数 有 效 地 址 是 芍 值 加 SI 再 加 1230H 
MY DX [EBPr 引 ; 源 操作 数 有 效 地 址 是 印 值 加 8 
【 例 6-7】〗 如 下 指令 演示 16 位 存储 器 寻 址 方式 的 使 用 ,操作 数 是 32 位 。 
MV EX [LS 把 SI 所 指 的 双 字 存 储 单元 的 值 送 到 EX 
AD EX [DI-4] 源 操作 数 的 有 效 地 址 是 D1 值 减 4 
SB [EXD], EX ;目的 操作 数 有 效 地 址 是 隐 值 加 上 D1 值 
MY [BX+SI+3, EX ;目的 操作 数 有 效 地 址 是 改 值 加 上 SI 值 再 加 3 


注意 ,在 16 位 存储 器 寻 址 方式 中 , 基 址 寄存 器 BX 或 BP 不 能 作为 变 址 寄存 器 , 变 址 寄存 
器 SI 或 DI 不 能 作为 基 址 寄存 器 。 所 以 ,不 能 同时 出 现 两 个 基 址 寄存 器 或 者 两 个 变 址 寄存 器 。 
还 需 注意 ,寄存 器 AX、CX、DX、SP 不 能 作为 基 址 寄存 器 ,也 不 能 作为 变 址 寄存 器 。 这 两 点 与 


32 位 存储 器 寻 址 方式 是 不 同 的 。 
【 例 6-8〗 如 下 指令 中 16 位 存储 器 寻 址 方式 的 使 用 是 非法 的 。 
WW EMX LSroU ;同时 使 用 了 sl 和 oI 
MW DX [AI :寄存 器 以 不 能 作为 基 址 或 变 址 寄存 器 
WW [or3, 作 桨 存 器 以 不 能 作为 基 址 或 变 址 寄存 器 


【 例 6-9】 如 下 指令 演示 针对 16 位 存储 器 寻 址 方式 取 有 效 地 址 指令 的 使 用 ,指令 执行 的 
结果 作为 注释 ,后 级 H 表示 十 六 进 制 。 


WW Dl, 134H DE 1234 
MV 以 14 Be Od 
LEA SI, LDI+BX+5] ;SI= 124H 
LEA EM [BXrDI- 习 ;ENE 00001248H 


在 实 方式 下 ,存储 段 的 长 度 不 能 超过 64KB, 所 以 无 论 是 逻辑 地 址 中 的 偏 移 , 还 是 存储 器 
寻 址 方式 中 的 有 效 地 址 ,最 大 为 FFFFH。 在 采用 16 位 存储 器 寻 址 方式 时 ,如 果 所 得 有 效 地 址 
超过 FFFFH ,那么 自动 丢掉 高 位 , 仅 保留 低 16 位 。 但 是 ,在 采用 32 位 存储 器 寻 址 方式 时 ,如 
果 所 得 有 效 地 址 超过 FFFFH ,在 访问 存储 器 时 ,将 会 引起 异常 。 在 第 9 章 中 会 详细 介绍 异常 
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及 其 处 理 。 


6.2 源 程序 和 语句 


汇编 语言 源 程序 由 语句 构成 ,汇编 语言 的 语句 可 分 为 指令 语句 、 伪 指令 语句 、 宏 指令 语句 
示 语 句 四 大 类 。 在 给 出 汇编 语言 源 程序 实例 之 后 ， 本 节 简要 介绍 汇编 语言 的 语 名 分类， 说 
令 语 句 和 伪 指令 语句 的 格式 。 


6.2.1 汇编 语言 源 程序 


通过 实例 来 了 解 汇 编 语言 源 程 序 的 组 织 , 可 以 更 好 地 理解 和 掌握 相关 概念 。 

1. 单个 段 的 源 程序 

先 来 看 一 个 简单 且 完 整 的 汇编 语言 源 程序 。 它 与 前 面 章节 中 介绍 的 岩 入 汇编 形式 的 代码 
不 同 , 也 与 由 C 语言 源 程序 得 到 的 汇编 格式 指令 表示 的 目标 程序 不 同 。 

【 例 6-10】 基于 汇编 器 NASM ,编写 一 个 显示 输出 “Hello,world” 的 程序 。 

如 下 程序 dp61. asm, 显 示 输 出 “Hello,world”, 分 号 之 后 是 注释 : 


和 指 
明 指 


segment text ;命名 段 text 

org 10H : 段 内 偏 移 从 10H 开 始 计 算 

Wy 俯 G 

MV DM ;使 数据 段 与 代码 段 相同 

Wy DX, hello :DE 信息 hello 的 段 内 偏 移 

W M9 

INT 2H ;显示 hello 开 始 的 字符 串 ( 以 $ 结 尾 ) 
WY AH 40H 


INT 2H ;返回 操作 系统 


hello 中 "Hellowrld", OH OH '$ ;定义 字符 串 信息 


利用 汇编 器 NASM 汇编 处 理 上 述 源 程序 ,可 以 直接 生成 一 个 COM 类 型 的 应 用 程序 。 具 
体 汇编 命令 行 如 下 所 示 ,在 10. 1 节 中 将 详细 介绍 汇编 器 NASM 的 使 用 。 


NASM dpbl.asm -0o db6l.com 


在 Windows(32 位 版 本 ) 控 制 台 窗口 中 ,可 以 直接 运行 应 用 程序 dp61. com。 运 行 时 ,在 屏 
幕 上 显示 信息 “Hello,world”。 

上 述 程序 的 代码 和 数据 都 在 一 个 段 内 ,操作 系统 (可 以 认为 是 Windows 的 DOS 模拟 器 ) 
在 把 它 装 和 运行 时 ,将 给 它 分 配 存 储 空间 。 在 操作 系统 把 控制 权 转 到 该 程序 时 ,将 设置 妥当 代 
码 段 寄 存 器 CS 和 指令 指针 寄存 器 IP。 

作为 COM 类 型 的 应 用 程序 ,程序 将 从 段 内 偏 移 100H 处 开始 执行 。 首 先 设置 数据 段 寄 
存 器 DS, 使 得 DS 与 CS 相同 ; 然后 调用 操作 系统 提供 的 特别 子 程序 (也 称 系统 功能 ) 的 9 号， 
显示 输出 字符 串 信 息 ; 最 后 又 调用 操作 系统 提供 的 系统 功能 的 4CH 号 ,结束 程序 的 运行 。 
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调用 系统 功能 类 似 于 调用 子 程序 ,也 会 用 到 出 人口 参数 。 编 号 为 9 的 系统 功能 是 显示 输 
出 字符 串 ,其 和 人口 参数 为 字符 串 首 地 址 ,DS 含有 段 值 ,DX 含有 偏 移 。 源 程序 中 的 标号 (名 称 ) 
hello, 表 示 对 应 字符 串 起 始 的 段 内 偏 移 。 

调用 系统 功能 的 方法 比较 简单 ,准备 好 相应 的 参数 ,包括 寄存 器 AH 含有 功能 编号 ,然后 
使 用 调用 指令 “INT 21H” 即 可 。 这 与 过 程 调 用 指令 CALL 类 似 。 

2. 多 个 段 的 源 程序 

现在 来 看 一 个 含有 多 个 段 的 源 程序 。 

【 例 6-11】 如 下 程序 dp62. asm 首先 接受 用 户 按 一 个 键 ,然后 以 两 位 十 六 进 制 数 的 形式 
显示 所 按键 的 ASCII 码 。 


segment code ;定义 段 code 
start: ;启动 标号 

MX A stack 
MV SS, MX ;设置 堆栈 段 寄 存 器 
MV Sp, stacktop ;设置 堆栈 顶 
Wy 以 data 
MV DS, 和信 ;设置 数据 段 寄存 器 
WY DX prapt 
CAL PrintStr ;显示 提示 信息 
Wy A 1 
INT 2H ;接收 用 户 按键 
My BL :临时 保存 所 按键 
Wy DX, newline 
CAL PrintStr 形成 回 车 换行 
WV LE :恢复 
SR AL4 
CAL ToAScIl ;把 高 4 位 转换 为 对 应 ASCN 码 
WY [result],AL ;保存 
W 人 LB 
CAL ToAscll ;把 低 4 位 转换 为 对 应 ASCN 码 
WY [resultt],AL ;保存 
Wy DX, result 
CAL PrintStr ;显示 结果 信息 
Wy A 40H 
INT 2H ;返回 操作 系统 

:显示 输出 指定 的 字符 串 

PrintStr: 汪 程 序 人 口 


PUSH 以 ;保护 寄存 器 以 





WwW BX DX 
LAB1: 
MY DL [eX] ;取出 待 显示 字符 
IN Bx ;指向 下 一 个 
oP DLL ;结束 符 吗 ? 
了 UB ; 遇 到 结束 符 ,结束 
MV AL 2 
INT 2IH ;显示 该 字符 
JP LBl ;继续 
LAB2: 
POP Bx :恢复 寄存 器 以 
RET 


:把 低 4 位 转 成 对 应 十 六 进 制 数 /ll 码 


ToAsC11: 浮 程 序 人 口 
AD AL OH 
AD A,'0' 
OP AL'9 
JE UB 
AD AL7 
LAB3: 
FET 
segment data ;定义 段 data 


pranrpt 中 "Pressakey:",' ' 


result 中 00 奉 放 十 六 进 制 数 Asoll 码 
db HOHON'S ;结果 字符 串 后 半 部 分 
segment stack stack ;定义 堆栈 段 
resb 1024 ;安排 124 字 节 作 为 堆栈 
stacktop: 


上 述 源 程序 dp62. asm 含有 3 个 段 , 即 代 码 段 ,数据 段 和 堆栈 段 。 它 们 分 别 由 段 定 义 请 句 
segment 开始 ,可 以 按 具体 需要 命名 各 个 段 。 当 然 有 意义 的 段 名 肯定 有 助 于 程序 的 阅读 和 理 
解 。 这 里 代码 段 的 段 名 为 code。 这 里 数据 段 的 段 名 为 data, 含 有 程序 要 使 用 到 的 数据 ,包括 
提示 信息 和 结果 信息 。 这 里 堆栈 段 的 段 名 为 stack, 段 名 之 后 的 段 类 型 stack 明确 表示 这 是 堆 
栈 段 , 它 含 有 1024 字 节 的 堆栈 空间 。 

在 经 过 汇编 和 链接 处 理 后 ,可 以 得 到 一 个 可 执行 程序 。 如 下 命令 行进 行 汇编 ,由 源 程 序 
dp62. asm 生成 目标 文件 dp62. obj ,细节 参见 10.1 节 。 





NM dam -fdj -oodhcbj 


如 下 命令 行进 行 链 接 , 由 目标 文件 dp62. obj 生成 可 执行 程序 dp62. exe, 注 意 命令 行 尾 的 





分 号 。 
LIK dhe; 


在 Windows(32 位 版 本 ) 控 制 台 窗 口中 ,可 以 直接 运行 应 用 程序 dp62. exe。 

操作 系统 在 把 它 装 人 运行 时 ,将 给 上 述 逻辑 上 的 3 个 段 ,分 配 3 个 相应 的 存储 段 。 在 操作 
系统 把 控制 权 转 到 它 时 ,将 设置 好 代码 段 寄 存 器 CS 和 指令 指针 寄存 器 IP。 

程序 将 从 标号 . . start 处 开始 执行 。 首 先 建立 堆栈 , 即 设置 堆栈 段 寄 存 器 SS 和 堆栈 指针 
SP; 然后 设置 数据 段 寄存 器 DS。 实 际 上 在 利用 汇编 器 NASM 汇编 生成 obj 类 型 的 目标 文件 
时 , 源 程序 中 的 段 名 data 和 stack 分 别 表示 对 应 段 的 段 值 。 在 此 基础 上 ,实现 相应 功能 。 首 先 
显示 提示 信息 ,接收 用 户 按键 ; 接着 把 用 户 所 按键 的 键 值 转换 为 两 位 十 六 进 制 数 的 ASCII 码 ， 
填 和 人 结果 字符 串 ; 然后 显示 输出 结果 字符 串 ; 最 后 返回 操作 系统 。 

子 程序 PrintStr 显示 输出 字符 串 ,但 没有 像 例 6-10 那样 ,调用 9 号 系统 功能 ,而 是 采用 人 循 
环 逐 字符 显示 。 类 似 地 ,调用 4CH 号 系统 功能 ,返回 操作 系统 。 在 程序 中 ,调用 1 号 系统 功 
能 ,接收 用 户 键盘 输入 ; 调用 2 号 系统 功能 ,显示 输出 一 个 字符 。 第 1 号 系统 功能 的 出 口 参数 
在 寄存 器 AL 中 ,也 就 是 所 按键 的 ASCII 码 值 。 第 2 号 系统 功能 的 入 口 参数 在 寄存 器 DL 中 ， 
是 要 显示 输出 字符 的 ASCII 码 。 

这 里 多 次 出 现 ASCII 码 的 概念 ,似乎 有 些 混乱 。 字 符 的 输入 和 输出 都 将 用 到 ASCII 码 。 
在 输入 前 ,键盘 上 的 键 位 ,代表 字符 ; 在 输出 后 ,屏幕 上 的 图 案 代表 字符 。 实 际 上 ,在 作为 数据 
表示 时 ,一 个 普通 的 字符 对 应 一 个 8 位 的 ASCII 码 (也 就 是 8 位 二 进 制 数据 ) ,也 可 以 说 ,一 个 
ASCII 码 代表 一 个 字符 。 在 输入 时 ,由 按键 得 到 ASCII 码 ; 在 输出 时 ,由 ASCII 码 得 到 图 案 。 
常常 采用 两 位 十 六 进 制 数 表 示 一 个 8 位 二 进 制 数 。 因 此 ,为 了 显示 输出 一 个 按键 的 ASCII 码 
值 ,需要 先 得 到 对 应 两 个 十 六 进 制 数 符号 的 ASCII 码 。 


6.2.2 语 旬 及 其 格式 


1. 语句 的 种 类 

汇编 语言 有 4 种 类 型 的 语句 ,分 别 是 指令 语句 、 伪 指令 语句 、 宏 指令 语句 和 指示 语句 。 实 
际 上 ,它们 分 别 对 应 指令 、 伪 指令 、 宏 指令 和 指示 。 

用 符号 表示 的 机 器 指令 称 为 汇编 格式 的 指令 。 指 令 语句 就 是 表示 汇编 格式 指令 的 语句 ， 
也 就 是 表示 符号 化 的 机 器 指令 的 语句 。 汇 编 器 在 对 源 程序 进行 汇编 时 ,把 指令 语句 翻译 成 机 
器 指令 。 在 例 6-10 和 例 6-11 给 出 的 源 程序 中 , 绝 大 部 分 是 指令 语句 ,它们 描述 由 处 理 器 执行 
的 具体 操作 。 

伪 指 令 并 非 真正 符号 化 的 机 器 指令 。 对 处 理 器 而 言 , 伪 指 令 不 是 指令 ,但 对 汇编 器 而 言 ， 
它 却 是 指令 。 伪 指令 主要 用 于 定义 变量 , 预 留存 储 单元 。 将 在 6. 4 节 中 介绍 常用 的 伪 指 令 。 
伪 指 令 语句 就 是 表示 伪 指 令 的 语句 。 在 例 6-11 的 数据 段 中 ,利用 伪 指 令 db 定义 了 字符 串 , 在 
堆栈 段 中 ,利用 伪 指 令 resb, 安 排 了 作为 堆栈 使 用 的 空间 。 

宏 指令 语句 表示 宏 指令 。 宏 指令 简称 宏 , 与 高 级 语言 中 宏 的 概念 相同 ,就 是 代表 一 个 代码 
片段 的 标识 符 。 宏 指令 在 使 用 之 前 要 先 声明 。 

指示 (directive) 也 常 称 为 汇编 器 指令 或 汇编 指令 , 它 指示 汇编 器 怎样 进行 汇编 ,如 何 生成 
目标 代码 。 为 了 避免 与 汇编 格式 指令 相 混淆 ,所 以 把 它 称 为 指示”。 在 例 6-10 和 例 6-11 中 
的 段 声明 语句 segment 就 是 指示 ,告诉 汇编 器 一 个 段 的 开始 。 
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2. 语句 的 格式 

指令 语句 和 伪 指 令 语 句 的 格式 是 相似 的 ,都 由 4 个 部 分 组 成 。 

(1) 指令 语句 的 格式 如 下 : 

[标号 : ] [指令 助 记 符 ] [操作 数 表 ] [; 注释 ] 

在 1.2.2 节 中 已 对 指令 语句 的 格式 作 过 简要 说 明 。 由 指令 助 记 符 和 对 应 的 操作 数 表 给 出 
具体 的 某 条 指令 。 操 作 数 的 个 数 与 具体 的 指令 有 关 , 可 以 多 个 ,也 可 以 没有 。 如 果 有 多 个 操作 
数 ,操作 数 之 间 用 逗号 分 隔 。 操 作 数 的 形式 也 与 具体 的 指令 有 关 , 可 以 是 常数 或 数值 表达 式 、 
寄存 器 (寄存 器 名 ) 或 者 存储 单元 (有 效 地 址 ) 。 

指令 语句 可 以 表示 处 理 器 支持 的 各 种 有 效 指令 。 

汇编 器 NASM 允许 省 略 标 号 后 的 冒号 。 但 建议 一 般 情况 下 ,不 要 省 略 冒 号 。 

(2) 伪 指 令 语句 的 格式 如 下 : 

[名 称 ] “[ 伪 指令 定义 符 ] [参数 表 ] [; 注释 ] 

伪 指 令 定 义 符 规定 了 伪 指 令 的 功能 。 一 般 伪 指 令 语句 都 有 参数 ,用 于 说 明 伪 指令 的 操作 
对 象 ,参数 的 类 型 和 个 数 随 着 伪 指 令 的 不 同 而 不 同 。 有 时 参数 是 常数 (数值 表达 式 ) ,有 时 参数 
是 一 般 的 符号 ,有 时 是 具有 特殊 意义 的 记号 。 伪 指令 语句 中 的 名 称 有 时 是 必需 的 ,有 时 是 可 省 
略 的 ,这 也 与 具体 的 伪 指令 有 关 。 名 称 之 后 也 可 以 有 冒号 ,但 一 般 不 用 。 

汇编 程序 忽略 由 分 号 开始 至 行 尾 的 注释 。 为 了 阅读 和 理解 程序 的 方便 ,程序 员 要 恰当 地 使 
用 注释 ,通过 注释 来 说 明 语 句 或 程序 的 功能 。 有 时 整 行 都 可 作为 注释 ,只 要 该 行 以 分 号 引导 。 

通常 一 个 语句 写 一 行 。 语 句 的 各 组 成 部 分 间 要 有 分 隔 符 。 标 号 后 的 冒号 是 现成 的 分 隔 
符 ,注释 引 导 符 分 号 也 是 现成 的 分 隔 符 。 此 外 ,空格 和 制 表 符 是 最 常用 的 分 隔 符 , 且 多 个 空格 
或 多 个 制 表 符 的 作用 与 一 个 空格 或 制 表 符 的 作用 相同 。 汇 编 过 程 中 ,作为 分 隔 符 的 空格 和 制 
表 符 会 被 忽略 (除非 作为 字符 串 中 的 字符 ) ,所 以 常 通过 在 语句 行 中 加 入 空格 和 制 表 符 的 方法 
使 上 下 语句 行 的 各 部 分 对 齐 , 以 方便 阅读 。 尽 管 对 齐 不 是 必需 的 ,但 肯定 有 助 于 阅读 。 参 数 之 
间 常 用 逗号 作 分 隔 符 ,但 有 时 也 用 空格 或 制 表 符 作 分 隔 符 。 

汇编 器 NASM 使 用 反 斜 杠 (\) 作 为 续 行 符 。 如 果 一 个 行 以 反 斜 杠 结束 , 那 随 后 的 行 会 被 
认为 是 前 面 一 行 的 一 部 分 。 

对 汇编 器 NASM 而 言 , 并 不 区 分 指令 语句 中 的 “标号 ”和 伪 指 令 语句 中 的 “名 称 ”, 它 们 都 属 
于 标识 符 或 者 符号 。 在 源 程序 中 引用 标号 和 名 称 ,它们 都 代表 相应 存储 单元 在 段 内 的 偏 移 ,也 就 
是 有 效 地 址 。 可 以 认为 ,标号 处 存储 单元 存放 的 是 指令 ,而 名 称 处 存储 单元 存放 的 是 数据 。 


3. 标识 符 
标识 符 由 字母 ,数字 及 一 些 特定 字符 (' 一 '、'$ '、'#'、'@'、' 一 '、'. ' 和 '?') 等 组 成 ,但 只 有 字 
母 、'.'、'_' 和 '?' 可 以 作为 标识 符 的 开头 。 标 号 和 名 称 作为 标识 符 ,它们 当然 也 必须 符合 上 述 规 


则 。 

标号 和 名 称 要 尽量 起 得 有 意义 ,这 会 大 大 有 助 于 程序 的 阅读 和 理解 。 

由 程序 员 命名 的 标识 符 不 应 该 是 汇编 语言 的 保留 字 。 汇 编 语言 中 的 保留 字 主 要 是 指令 助 
记 符 、 伪 指令 定义 符 和 寄存 器 名 ,还 有 一 些 其 他 的 特殊 保留 字 。 但 是 ,汇编 器 NASM 允许 一 个 
标识 符 加 上 一 个 $ 前 缀 ,以 表明 它 被 作为 一 个 标识 符 而 不 是 保留 字 来 处 理 。 这 样 可 以 用 
“$ eax” 表 示 标 识 符 “eax”, 而 非 寄 存 器 eax。 

汇编 器 NASM 是 大 小 写 敏感 的 , 它 区 分 大 小 写字 母 。 这 一 点 与 有 些 汇编 器 不 同 。 这 就 意 
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味 着 ,对 由 程序 员 命名 的 标识 符 而 言 ,出 现在 标识 符 中 的 大 小 写字 母 是 不 同 的。 当然 ,对 指令 
助 记 符 、 伪 指令 定义 符 和 寄存 器 名 等 保留 字 而 言 , 大 小 写 并 没有 区 别 。 


6.3 操作 数 表示 


指令 的 操作 数 通常 在 寄存 器 或 者 存储 单元 中 ,有 时 也 会 是 立即 数 。 在 NASM 的 汇编 格式 
指令 中 ,通用 寄存 器 和 段 寄 存 器 都 直接 用 寄存 器 名 表示 ,比较 直接 和 简单 。 立 即 数 就 是 常数 ， 
可 以 有 多 种 表示 形式 。 存 储 单元 的 表示 就 是 存储 器 寻 址 方式 的 表示 ,也 就 是 有 效 地 址 的 表示 。 
本 节 将 介绍 常数 ,数值 表达 式 和 有 效 地 址 。 


6.3.1 常数 


汇编 器 NASM 能 够 识别 4 种 不 同类 型 的 常数 : 整数 .字符 .字符 串 和 浮 点 数 。 

1. 整数 

在 没有 特别 标记 时 ,一 个 整数 由 十 进 制 表 示 ,也 可 以 采用 十 六 进 制 \ 八 进 制 和 二 进 制 形式 
表示 。 后 组 H 表示 十 六 进 制 数 ,后 级 Q 或 O 表示 八进制 数 ,后缀 B 表示 二 进 制 数 。 当 然 也 可 以 
用 后 缀 D 表示 十 进 制 数 ,但 一 般 不 会 这 样 做 。 为 了 避免 与 普通 标识 符 混 消 , 十 六 进 制 数 应 以 数字 
开头 ,如 果 以 字母 开头 ,应 该 再 加 上 数字 0。 还 可 以 采用 C 风格 的 前 级 0x 表示 十 六 进 制 数 。 

【 例 6-12】 如 下 汇编 格式 指令 说 明 多 种 整数 的 表示 形式 ,汇编 时 汇编 器 NASM 将 生成 完 
全 相同 的 代码 ,分 号 之 后 是 注释 。 

















MW 以 地 十进制 表示 

MW AX OlB ;仍然 表示 十 进 制 数 

WW 以 16 ;后 绥 0, 代表 十 进 制 数 

WW A Oh ;后 级 Ht 代表 十 六 进 制 数 

MY 以 10101000B 后 级 B, 代表 二 进 制 数 

WW A 20 后 级 Q 代表 八进制 数 

MW A 20%0 滞 级 0, 代表 八进制 数 

MY AX O48 泣 级 ,代表 十 六 进 制 数 
【 例 6-13】 如 下 汇编 格式 指令 说 明 多 种 整数 表示 形式 的 使 用 特点 。 

RR MX 880H 

AD BL OH 


在 表示 整数 时 ,NASM 还 可 以 更 灵活 。 

2. 字符 

字符 常数 是 一 对 单 引 号 (或 者 双 引 号 ) 之 间 的 若干 个 字符 。 每 个 字符 表示 一 个 字 节 (8 个 
二 进 制 位 ) ,可 以 认为 字符 的 值 是 对 应 ASCII 码 值 。 在 表示 32 位 数据 时 ,包含 在 一 对 引号 中 
的 字符 常数 最 多 可 以 由 4 个 字符 组 成 。 对 于 由 多 个 字符 组 成 的 字符 常数 ,在 存储 时 出 现在 前 
面 的 字符 占用 低地 址 存储 单元 。 这 样 ,按照 "高 高 低 低 ? 存 储 规 则 ,出 现在 前 面 的 字符 代表 了 数 
值 的 低位 。 

【 例 6-14】 如 下 汇编 格式 指令 说 明 字 符 常 数 的 表示 及 其 值 , 分 号 之 后 的 注释 给 出 在 执行 
指令 后 相关 寄存 器 的 内 容 , 后 绥 H 表示 十 六 进 制 。 





WW A,'a A= 6lH 
WW 从 al JAE 00IH 
MV A 'ab' ‘AE oH 
MW EM 'abod' ;EAE 64636201H 
MW BX 'abod' ;BE 6IH 


由 于 最 后 一 条 指令 中 的 字符 常数 太 大 ,汇编 过 程 中 ,汇编 器 NASM 会 给 出 警告 ,并 抛弃 高 


位 部 分 。 


【 例 6-15】 如 下 汇编 格式 指令 说 明 表 示 字 符 常 数 时 单 引 号 和 双 引 号 的 互 换 ,分 号 之 后 的 


注释 给 出 在 执行 指令 后 相关 寄存 器 的 内 容 ,后 组 H 表示 十 六 进 制 。 


WW 人 L :A= 2 
WW AL"， :A=2H 
WY BL."A ;BE= 4H 
WwW EB"/B :BE dadtH 
3. 字符 串 


字符 串 常数 与 字符 常数 很 相近 ,但 是 字符 串 常 数 可 以 含有 更 多 的 字符 。 字 符 串 常数 往往 


出 现在 一 些 数据 定义 伪 指 令 中 ,请 参见 6.4 节 。 
6.3.2 数值 表达 式 


在 汇编 语言 中 表达 式 的 概念 与 C 语言 中 是 一 样 的 ,由 运算 符 和 括号 把 常数 .记号 和 标识 
符 等 连接 起 来 的 式 子 , 称 为 表达 式 。 所 谓 数值 表达 式 ,是 指 在 汇编 过 程 中 能 够 由 汇编 器 计算 出 
具体 数值 的 表达 式 ,所 以 组 成 数值 表达 式 的 各 部 分 必须 在 汇编 时 就 能 完全 确定 。 

表 6. 1 按 优先 级 的 顺序 由 低 到 高 列 出 了 汇编 器 NASM 支持 的 运算 符 。 其 中 , 按 位 或 运算 


符 的 优先 级 最 低 , 单 目 运 算 符 的 优先 级 最 高 。 
表 6.1 运算 符 及 其 优先 级 





















































优先 级 运算 符 运算 说 明 运算 对 象 个 数 
7 | 按 位 或 (类 似 指令 OR) 2 
6 按 位 异 或 (类 似 指令 XOR) 2 
5 & 按 位 与 (类 似 指 令 AND) 2 
>> 逻辑 左 移 ( 类 似 指令 SHL) 2 

ES 逻辑 右 移 (类 似 指令 SHR) 2 

本 十 加 运算 2 
减 运算 2 

x 乘 2 

/ 无 符号 除 2 

2 // 有 符号 除 四 
% 无 符号 模 2 

%% 有 符号 模 2 

过 加 号 1 

E 负 号 

1 3 按 位 取 反 (类 似 指 令 NOT) 
! 逻辑 否 i 

seg 获得 段 值 入 
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注意 ,对 除法 运算 和 取 模 运算 ,NASM 区 分 有 符号 和 无 符号 。 
【 例 6-16】 如 下 汇编 格式 指令 演示 运算 符 的 使 用 ,注释 给 出 在 执行 指令 后 相关 寄存 器 的 
内 容 , 后 级 H 表示 十 六 进 制 。 


MV ”AL Of000111B | 00100000B :A= 6H 
MV ”AL O11OIO0B & 11011111B ;AL= 4 
MY AL oH<4 A= 3H 
MW AL 8H>6 :A= 0H 
MV A, ~ O000000lB A=FH 
MV A,!1 A= OH 
MV A,-1 A=FFH 


【 例 6-17】 如 下 汇编 格式 指令 还 是 演示 运算 符 的 使 用 ,注释 给 出 在 执行 指令 后 相关 寄存 
器 的 内 容 , 后 级 日 表示 十 六 进 制 。 


WW D4H<243 :DL= EH 
WwW EX-10/4 ;DX FFFFFFFDH 
MW  DL -10/4 ;DL= FEH 


汇编 过 程 中 ,对 上 述 第 一 条 指令 中 的 表达 式 ,NASM 会 发 出 结果 太 大 的 警告 。 将 43H 左 
移 5 位 的 结果 是 860H ,超过 DL 的 范围 。 类 似 地 ,对 上 述 第 二 条 指令 中 的 表达 式 ,NASM 也 
会 发 出 警告 。 由 于 除法 运算 符 “/” 表 示 无 符号 除 ,所 以 -10 作为 一 个 无 符号 数 时 , 它 代表 一 个 
很 大 的 值 ,在 除 以 4 后 的 商 仍然 很 大 ,超过 32 位 。 

由 于 NASM 在 计算 表达 式 时 至 少 使 用 32 位 长 度 ,因此 需要 谨慎 对 待 整 型 数 溢出 的 情况 。 
所 幸 例 6-17 仅仅 是 为 了 说 明 运 算 符 的 作用 ,一 般 不 会 这 样 做 。 


6.3.3 有效 地 址 


有 效 地址 给 出 存储 单元 ,有 效 地 址 的 表示 就 是 存储 器 操作 数 的 表示 。 
汇编 器 NASM 支持 32 位 存储 器 寻 址 方式 ,也 支持 16 位 存储 器 寻 址 方式 。 
【 例 6-18】 如 下 汇编 格式 的 指令 说 明 有 效 地 址 的 表示 。 
人 L [BX] 
从 [S+3 
从 [BX+ DI-5] 
MX [EX] 
MX [ESI+ EM 
MX [EDX+ 4+ ESI+ 8] 

上 述 指令 中 , 源 操作 数 都 是 存储 器 操作 数 , 采 用 16 位 存储 器 寻 址 方式 或 者 32 位 存储 器 寻 
址 方式 ,存储 单元 有 效 地 址 的 表达 式 出 现在 方 括号 中 。 

为 了 直观 明确 ,汇编 器 NASM 要 求 表 示 存 储 单元 有 效 地 址 的 表达 式 只 能 出 现在 方 括号 
中 。 即 使 是 标号 或 者 名 称 , 当 它们 表示 存储 单元 内 容 时 ,也 必须 出 现在 方 括号 中 。 这 一 点 与 有 
些 汇编 器 不 同 。 

【 例 6-19】 演示 有 效 地 址 的 表示 。 假 设 变 量 wordvar 是 由 如 下 伪 指 令 语句 定义 的 一 个 字 
存储 单元 。 

wordvar DW 1234 

如 下 汇编 格式 指令 说 明 与 变量 wordvar 相关 的 有 效 地 址 的 表示 。 


瑟瑟 豆 豆 豆 怠 
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MN AX [wordvar] :直接 寻 址 

MV ”以 [wordvar+ 2] :直接 寻 址 

MV AX [wordvar- 相 :直接 寻 址 

MX AX [wordvart BX] :寄存 器 相对 寻 址 
MV AX [SI+ wordvar] 沫 存 器 相对 寻 址 
MV AX [BX+DI+wordvar] ;相对 基 址 变 址 寻 址 


在 上 述 指令 中 ,变量 名 wordvar 表示 该 变量 在 存储 段 中 的 段 内 偏 移 (有 效 地 址 ) 值 。 假 设 
变量 wordvar 的 段 内 偏 移 值 是 100H ,那么 “wordvar 十 2” 表 示 有 效 地 址 102H, “wordvar 一 3” 
表示 有 效 地 址 0OFDH。 类 似 地 ,“wordvar 十 BX” 表 示 的 有 效 地 址 是 寄存 器 BX 的 内 容 加 
上 100H。 

如 果 需 要 采用 段 超越 前 级 直接 指定 所 引用 的 段 寄存 器 ,那么 也 应 该 把 段 超越 前 级 安排 在 
方 括号 中 。 这 也 与 有 些 汇编 器 不 同 。 

【 例 6-20】 如 下 指令 说 明 段 超越 前 级 的 表示 ,其 中 标识 符 bytevar 是 一 个 变量 名 。 

MY DL [ES:bytevar] 直接 寻 址 
MV DL [GS:BX+ bytevar] ; 冤 存 器 相对 寻 址 


6.3.4 数据 类 型 说 明 


IA-32 系列 CPU 能 够 处 理 8 位 ( 字 节 )、16 位 ( 字 ) 或 32 位 ( 双 字 ) 数 据 。 绝 大 部 分 情况 下 ， 
能 够 根据 存放 操作 数 的 寄存 器 来 确定 操作 数 的 类 型 (尺寸 )。 但 是 ,类 似 如 下 的 指令 ,操作 数 的 
类 型 不 明确 ,汇编 器 NASM 会 报告 错误 。 
WW [ed,1 
AD [Di+3 引 ,5 
SB [ESI+ECX:4],6 
汇编 器 NASM 提供 了 BYTE、WORD、DWORD 等 关键 字 , 用 于 说 明 操作 数 的 类 型 ( 尺 
寸 )。 把 这 些 关 键 词 称 为 类 型 符 。 实 际 上 ,在 VC 2010 的 嵌入 汇编 中 或 者 由 VC 2010 生成 的 
汇编 格式 目标 代码 中 ,经 常 可 以 看 到 利用 “BYTE PTR”*DWORD PTR” 和 “WORD 
PTR” 指 定 操作 数 的 类 型 。 
【 例 6-21】 如 下 汇编 格式 指令 演示 指定 操作 数 的 类 型 。 


MV DORD [EX ,1 ; 双 字 
AD BYIE [DI+3],5 闻 节 
SB WFD [ESI+ECX4], 6 闻 
MV [BO], DORD 1 ; 双 字 
AD [Di+3, ME5 学 节 
SB [ESI+EXt4], WR 6 字 


注意 ,在 NASM 中 ,省 略 了 PTR。 

上 述 指令 中 ,前 一 组 三 条 指令 在 存储 单元 有 效 地 址 之 前 使 用 类 型 符 ,指定 了 操作 数 的 类 型 
(尺寸 ) ,后 一 组 三 条 指令 在 立即 数 之 前 使 用 了 类 型 符 ,它们 的 功效 相同 。 因 为 这 些 指令 中 两 个 
操作 数 的 尺寸 必须 一 致 ,所 以 指定 一 个 操作 数 的 类 型 就 够 了 。 这 两 组 指令 中 的 三 条 指令 分 别 
一 一 等 价 。 
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【 例 6-22】 如 下 汇编 格式 指令 演示 指定 操作 数 的 类 型 。 


IN BYE [BX 学 节 
DEC WARD [EX-g8 字 
INC DRD [otooH] ; 双 字 
PUSH DWORD 99AAH ; 双 字 
PUSH DWRD 12345678H ; 双 字 
PUSH WRD 9H 字 


指令 中 ,只 有 一 个 操作 数 ,通过 类 型 符 明确 操作 数 的 类 型 。 
对 于 把 立即 数 床 和 人 堆栈 的 PUSH 指令 ,在 16 位 代码 中 默认 的 操作 数 是 字 , 在 32 位 代码 
中 默认 的 操作 数 是 双 字 ,所 以 需要 明确 操作 数 类 型 。 另 外 ,由 于 PUSH 指令 的 操作 数 至 少 是 
16 位 的 ,因此 不 能 使 用 类 型 符 BYTE。 
汇编 器 NASM 还 提供 了 关键 字 FAR 和 NEAR, 用 于 说 明 标号 的 类 型 (远近 ) 。 


6.4 伪 指令 语句 和 变量 


伪 指 令 语句 主要 包含 数据 定义 语句 和 存储 单元 定义 语句 ,前 者 定义 初始 化 的 数据 项 ,后 者 
定义 未 初始 化 的 数据 项 。 本 节 将 介绍 它们 的 使 用 方法 ,还 介绍 常数 符号 声明 语句 。 


6.4.1 数据 定义 语句 


数据 定义 语句 是 常用 的 伪 指 令 语 句 

通过 数据 定义 请 句 可 为 数据 项 分 配 存储 单元 .并 根据 需要 设置 其 初 值 .还 可 用 名 称 (标识 
符 ) 代 表 数 据 项 ,此 时 名 称 (标识 符 ) 就 与 分 配 的 存储 单元 相 联 系 。 

1. 数据 定义 语句 格式 

按 6.2.2 节 介 绍 的 伪 指令 语句 格式 ,数据 定义 语句 的 一 般 格 式 如 下 : 


[名 称 ] DB 参数 表 ;定义 字 节 数据 项 
[名 称 ] 只 参数 表 ;定义 字数 据 项 
[名 称 ] 吧 参数 表 ;定义 双 字 数据 项 


其 中 ,DB、DW 或 DD 分 别 是 伪 指 令 符 。 第 一 个 字母 D 的 含义 是 “定义 ”, 第 二 个 字母 代表 
了 数据 类 型 ,分 别 是 字 节 (Byte) . 字 (Word) 和 双 字 (DoubleWord) 。 
【 例 6-23】 如 下 伪 指 令 演示 数据 定义 语句 的 使 用 ,各 数据 项 之 间 由 逗号 分 隔 。 


result 中 00 ;定义 2 个 字 节 , 字 节 值 为 0 
中 'H, OH OH '$ ;定义 4 个 字 节 

war dy -1 ;定义 1 个 字 , 值 为 FFFH 
d 517 :定义 2 个 双 字 


名 称 是 可 选 的 ,如 果 使 用 名 称 , 那 么 它 就 代表 存储 单元 的 有 效 地 址 。 确 切 地 说 ,名 称 代表 
该 语句 所 定义 的 若干 数据 项 中 第 一 个 数据 项 对 应 存储 单元 的 有 效 地 址 。 

数据 项 的 初 值 还 可 以 是 数值 表达 式 。 

在 6.2 节 的 例 6-10 演示 程序 dp61 中 和 例 6-11 演示 程序 dp62 中 ,都 利用 伪 指 令 db ,定义 
了 需要 的 数据 项 。 
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【 例 6-24】 如 下 伪 指 令 演 示 数 据 定义 语句 的 使 用 ,数据 项 是 表达 式 ,注释 中 的 后 级 本 表 
示 十 六 进 制 。 


| 


bvar 中 234 Xx3>4 ;定义 2 个 字 节 ,分 别 是 OH 和 OH 
vector dd (QABD<< 190 + 0xl234 ;定义 1 个 双 字 = 0BD1234 
dy -1 ;定义 1 个 字 =GOFTFFFH 
注意 ,负数 采用 补 码 表示 。 
2. 存储 单元 初始 化 


汇编 器 NASM 按照 数据 定义 语句 给 出 的 初 值 ,初始 化 相关 存储 单元 。 而 且 ,NASM 为 多 
条 相 邻 的 数据 定义 语句 ,分 配 连 续 的 内 存单 元 。 

【 例 6-25】〗 设 有 如 下 数据 定义 语句 。 

wordvar dy 1234 55H 

dar dd 虽 

abcstr 中 'A', 'B', OH OH '$ 

对 应 分 配 的 存储 单元 及 其 值 如 图 6.5 所 示 ,其 中 每 一 项 为 一 个 字 节 ,数值 采用 十 六 进 制 表 
示 。 从 图 6.5 可 知 ,字符 是 对 应 的 ASCII 码 值 。 由 于 采用 “高 高 低 低 ”规则 存储 ,因此 看 上 去 
似乎 不 习惯 。 





-一 高 地 址 

















| 一 一 一 一 | 一 一 abcstr 


00 
00 














一 一 dvar 

















wordvar 
ee | 低地 址 
图 6.5 例 6-25 存储 单元 安排 示意 图 


当 数 据 项 的 初 值 由 多 个 字符 或 者 字符 串 构成 时 ,它们 按 字符 依次 存储 。 
【 例 6-26】 如 下 数据 定义 语句 分 别 是 等 价 的 。 


中 hello' 盖 个 字符 串 等 价 于 如 下 

中 hs 人 se se ‘0' ;多 个 字符 

dd ninechars' ;这 个 字符 串 作 为 双 字 数据 项 
dd nine'，'char'，'s' ;相当 于 3 个 双 字 

中 'ninechars', 000 :实际 就 是 这 样 


单 引号 和 双 引 号 起 同样 的 作用 。 
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3. 初始 化 的 变量 

在 数据 定义 语句 中 定义 的 数据 项 占用 存储 单元 ,可 以 把 它 作 为 变量 。 在 定义 语句 中 的 名 
称 相 当 于 变量 名 。 类 似 于 高 级 语言 ,通过 变量 名 ,可 以 访问 变量 ,本 质 上 是 存 取 对 应 的 存储 
单元 。 

【 例 6-27】 演示 变量 的 定义 和 引用 。 设 有 如 下 数据 定义 语句 ,定义 3 个 字 变 量 和 1 个 双 
字 变 量 , 现 要 计算 这 3 个 无 符号 字 变 量 之 和 ,并 存放 到 双 字 变量 中 。 

warray dy A455H 7H 2HH 

sum do0 


如 下 代码 片段 能 够 实现 上 述 要 求 ,假设 事先 已 经 设置 好 了 段 寄 存 器 DS 的 值 。 


以 [warrayt 2] 
DX 0 
以 [warrayt 4 
DX 0 
[sm, 以 
[sumt 2], DX 
变量 名 代表 了 对 应 存储 单元 的 有 效 地 址 ,在 通过 变量 名 存 取 变 量 时 ,必须 把 变量 名 放 在 方 
括号 中 。 从 上 述 代 码 片 段 可 知 , 在 汇编 语言 中 ,由 程序 员 自 己 根据 数据 类 型 计算 偏 移 。 在 
NASM 中 ,还 需要 程序 员 自 己 关 心 数据 类 型 ,对 上 述 最 后 两 条 指令 ,汇编 过 程 中 不 会 出 现 警告 
信息 。 这 与 有 些 汇编 器 不 同 。 
【 例 6-28】 换 一 种 方法 实现 例 6-27。 假 设 同样 的 数据 定义 语句 ,也 假设 设置 好 了 DS 值 。 
WV Sl, warray 把 变量 有 效 地 址 送 到 SI 
MNZX EAX WORD [SU 
MNZX EDX WORD [SI+ 习 
AD EX EX 
MNZX EDX WORD [SI+] 
AD EAX EX 
MV [sum] ，EAX :把 E 以 送 到 sm 单元 
在 上 述 代码 片段 中 ,重点 是 首 末 两 条 指令 。 在 第 一 条 指令 中 ,变量 名 warray 没有 出 现在 
方 括号 中 ,该 指令 是 把 变量 warray 的 有 效 地 址 送 到 寄存 器 SI, 并 非 变 量 的 值 。 最 后 一 条 指令 
是 把 EAX 的 值 送 到 双 字 变量 sum 中 。 中 间 几 条 指令 中 的 关键 字 WORD 是 类 型 符 , 说 明 存 储 
单元 的 尺寸 。 注 意 与 第 5 章 及 之 前 的 VC 2010 嵌入 汇编 在 表示 形式 上 的 不 同 。 
6.4.2 存储 单元 定义 语句 
1. 存储 单元 定义 语句 
存储 单元 定义 语句 也 是 伪 指 令 语句 。 
利用 存储 单元 定义 语句 可 以 分 配 存 储 单元 ,但 没有 初始 化 ,也 可 用 名 称 代 表 存 储 单元 。 如 
果 把 这 样 的 存储 单元 视 为 变量 ,那么 就 是 没有 初始 化 的 变量 。 
存储 单元 定义 语句 的 一 般 格 式 如 下 : 
[名 称 ] RESB 项 数 ; 预 留 字 节 存储 单元 


各 得 吾 吾 吾 吾 豆 豆 
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[名 称 ] RESW 项 数 ; 预 留 字 存 储 单元 
[名 称 ] RESD 项 数 ; 预 留 双 字 存 储 单元 
其 中 ,“ 项 数 ” 表 示 要 定义 的 存储 单元 个 数 ,可 以 是 一 个 数值 表达 式 。 这 些 语句 中 RESB、 
RESW 或 RESD 分 别 是 伪 指令 符 。RES 的 含义 是 “ 预 留 ”, 其 后 的 字母 代表 了 存储 单元 类 型 ， 
分 别 是 字 节 (Byte) 、 字 (Word) 和 双 字 (DoubleWord)。 
名 称 是 可 选 的 ,如 果 使 用 名 称 , 那 么 它 就 代表 预 留存 储 单元 的 首 地 址 。 
【 例 6-29】 如 下 伪 指 令 演 示 存 储 单元 定义 语句 的 使 用 。 


buffer resb 1B ; 预 留 {Bp 个 字 节 
wordtab resw 4 ; 预 留 4 个 字 
farptr resd 1 ; 预 留 1 个 双 字 


存储 单元 定义 语句 中 的 “项 数 ” 还 可 以 是 一 个 数值 表达 式 。 
在 6.2 节 的 例 6-11 中 ,利用 伪 指 令 RESB 安排 了 1024 个 字 节 的 堆栈 空间 。 
【 例 6-30】 如 下 伪 指 令 演示 存储 单元 定义 语句 的 使 用 ,其 中 存储 单元 项 数 是 一 个 表 
达 式 。 
abuff RESB 32+2 ; 预 留 个 字 节 
wtable RESW 3+5 ; 预 留 8 个 字 
注意 ,表示 项 目 个 数 的 表达 式 ,必须 是 当时 马上 可 以 计算 出 结果 的 表达 式 。 
2. 重复 汇编 前 组 
汇编 器 NASM 提供 了 一 个 重复 汇编 前 级 TIMES, 利 用 这 个 前 级 能 够 使 得 伪 指 令 或 者 指 
令 被 重复 汇编 多 次 。 使 用 的 一 般 格 式 如 下 : 
TIWMES 重复 次 数 表达 式 ” 伪 指令 或 者 指令 
其 中 ,代表 重复 次 数 的 表达 式 应 该 是 可 以 立即 计算 的 。 
【 例 6-31】 如 下 语句 分 别 定义 10 个 字 节 的 存储 单元 和 8 个 字 的 存储 单元 ,而 且 对 这 些 存 
储 单元 进行 了 初始 化 。 
tims 10 中 3 重复 "中 3" 10 次 
tims 2+6 dy 124 重复 "dw 124" 8 次 
【 例 6-32】 如 下 语句 生成 6 条 MOVSB 指令 。 
times 3+2 MNSB 
请 注意 上 述 语句 与 “REP MOVSB” 的 区 别 。 
6.4.3 常数 符号 声明 语句 
1. 常数 符号 化 
用 符号 表示 常数 或 者 数值 表达 式 往往 是 个 好 主意 。 这 样 不 仅 有 利于 维护 程序 ,也 有 利于 
阅读 程序 。 汇 编 器 NASM 提供 把 常数 符号 化 的 伪 指 令 。 
常数 符号 声明 语句 的 格式 如 下 : 
符号 名 好 数值 表达 式 
汇编 过 程 中 ,NASM 会 计算 出 数值 表达 式 的 值 ,然后 符号 就 代表 计算 结果 。 在 随后 的 程 
序 中 ,就 可 以 使 用 该 符号 代替 这 个 表达 式 。 
【 例 6-33】 如 下 语句 演示 常数 符号 声明 伪 指令 的 使 用 。 





ONT eq 5+3:2 ;OOUNT 代表 11 
MN eu 8 :MIN 代表 8 
MX eq MN+ONT+2D ;MX 代表 隐 


从 上 面 的 伪 指 令 可 知 ,表达 式 可 以 含有 事先 已 经 声明 过 的 其 他 常数 符号 。 实 际 上 ,还 可 以 
包含 在 前 面 已 经 出 现 过 的 标号 和 名 称 等 标识 符 。 可 以 简单 地 认为 ,之 前 已 经 出 现 过 (定义 过 ) 
是 重要 的 前 提 。 

【 例 6-34】 如 下 代码 演示 常数 符号 声明 伪 指 令 的 使 用 。 


hello db "Helloworldl", OH OH '$' ; 鸽 个 字 节 

hello2: ;安排 一 个 标号 

MESRN eq hello- hello ;MESRN 代 表 15 

dont dd NSA ;定义 双 字 ,初始 值 为 VESLRN 
buffer resb NESLRN ;保留 MESLBN 个 字 节 


上 述 字符 串 hello 是 确定 的 ,其 长 度 在 汇编 时 就 可 以 确定 。 因 为 标号 和 名 称 都 表示 对 应 
存储 单元 在 段 内 的 偏 移 ,hello 代表 了 开始 处 的 偏 移 ,而 hello2 代表 了 结束 处 的 偏 移 , 所 以 
MESLEN 就 代表 了 字符 串 hello 的 长 度 。 实 际 上 ,hello2 与 dcount 具有 相同 的 值 。 

假设 已 经 安排 了 上 述 语句 ,如 下 代码 片段 功能 是 复制 字符 串 hello 到 缓冲 区 buffer 中 : 

MY ESI, hello 
MY EI, buffer 


MY EX MESEN :EOE 字符 串 hello 长 度 
RP MNVSB 
上 述 代码 仅仅 是 为 了 说 明 相 关 伪 指令 而 使 用 的 演示 代码 。 
2. 特殊 记号 $ 和 $$ 
汇编 器 NASM 支持 在 表达 式 中 出 现 两 个 特别 的 记号 , 即 '$ ' 和 '$ $'。 利 用 这 两 个 记号 ， 
可 以 方便 地 获得 当前 位 置 值 。 
单个 $ 的 作用 。 记 号 $ 代表 它 所 在 源 代码 行 的 指令 或 者 数据 开始 处 在 整个 程序 中 的 相对 
偏 移 。 所 以 ,如 下 指令 表示 跳 转 到 自己 ,形成 无 限 循环 : 
jm $ 
利用 $ 记号 ,可 以 改写 例 6-34, 省 略 标号 hello2。 青 来 看 一 个 类 似 的 示例 。 
【 例 6-35】 如 下 伪 指 令 使 得 message 占用 的 字 节 数 是 16 的 倍数 。 
message 中 " asdf jkl" 


resb 106(STRN% 10) 

从 上 述 代码 可 知 ,利用 记号 $ ,计算 出 message 本 身 的 长 度 , 再 通过 保留 若干 字 节 来 使 得 
实际 占用 的 字 节 数 为 16 的 倍数 。 但 有 一 点 不 足 , 如 果 message 本 身长 度 就 是 16 的 倍数 ,将 多 
占用 16 个 字 节 。 

另 一 个 使 用 重复 汇编 前 缀 的 方法 如 下 , 它 能 够 使 得 message 占用 的 字 节 是 16。 

message 中 " asdfjkl" 

times 16-($-mssage) 中 0 
双 $ 的 作用 。 记 号 $$ 代表 当前 段 开 始 处 在 整个 程序 中 的 相对 偏 移 。 一 个 源 程序 可 能 含 
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有 多 个 段 ,利用 记号 $ $ 可 以 获得 当前 段 的 起 点 。 所 以 ,通过 表达 式 ($-$ $ ) 得 到 当前 位 置 


在 当前 段 内 的 差 值 。 
【 例 6-36】 如 下 语句 使 得 data 段 的 长 度 为 512 字 节 , 且 以 标记 55H 和 0AAH 结尾 。 
seement data ;定义 段 data 
DB ”how are you” 
tims 510-($-$$) db0 ;填充 0, 直到 满 50 字 节 
DB 5 OWH ;最 后 两 字 节 


6.4.4 演示 举例 


【 例 6-37】 编写 一 个 控制 台 应 用 程序 ,显示 指定 内 存单 元 的 内 容 。 

如 下 程序 dp63. asm 实现 所 需 功 能 。 首 先 接 收 用 户 从 键盘 输入 的 某 存 储 单元 地 址 的 段 
值 ; 接着 接收 用 户 从 键盘 输入 的 某 存储 单元 地 址 的 偏 移 ; 然后 取出 对 应 存储 单元 的 字 节 数 
据 , 并 显示 输出 。 

由 用 户 从 键盘 分 别 输入 段 值 和 偏 移 , 来 指定 存储 单元 , 段 值 和 偏 移 都 采用 十 六 进 制 表示 。 
显示 输出 所 指定 存储 单元 的 内 容 , 采 用 二 进 制 表示 。 


segment code 有 段 code 
org 10H 起 始 偏 移 10H 
begin: 
WwW AOC ;使 得 数据 段 与 代码 段 相同 
MY DX ;DS- CS 
MY DX mess1 ;DE mess1 的 偏 移 
CAL Echoess ;显示 输出 提示 信息 mess1 
MV DX buffer ;DE buffer 的 偏 移 
CAL Gethex ;由 键盘 输入 一 个 十 六 进 制 数 
MM [adrseg], MX ;保存 ,作为 指定 存储 单元 的 段 值 
CAL Newine :形成 回 车 换行 
MY DX mess2 ;DE mess2 的 偏 移 
CAL 。 Echodess ;显示 输出 提示 信息 mess2 
MW DX buffer :DE buffer 的 偏 移 
CAL Gethex ;由 键盘 输入 一 个 十 六 进 制 数 
MW [addrDisp], AX ;保存 ,作为 指定 存储 单元 的 偏 移 
CAL Neine :形成 回 车 换行 
MW ES [addrSeg] ;取出 段 值 , 送 到 外 
MV BX [addmisp] ;取出 偏 移 , 送 到 也 
WW A, [ES:BX] ;取出 指定 存储 单元 的 字 节 值 
COAL EchoBin ; 按 二 进 制 形式 显示 
WwW A 40H 
INT 2H ;结束 程序 ,返回 操作 系统 


; 子 程序 名 : Gethex 
: 功 能: 接收 由 键盘 输入 的 十 六 进 制 数 ,并 转换 成 二 进 制 值 
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;人口 参 数 : Ds:DE 用 于 存放 字符 串 缓冲 区 的 开始 地 址 


( 首 字 节 含有 实际 的 缓冲 区 有 效 长 度 ) 


站 口 参数 : 所 二 进 制 值 ( 由 字符 串 转 换 所 得 ) 
说 明 : 不 考虑 非法 输入 ,实际 输入 字符 数 应 是 缓冲 区 字 节 数 
GetHex 


sl 
BX 


LOP LL1@ GetHex 





Wy a, [sD 
LEA BX [SI+] 
XR DX DX 


; 子 程序 名 : ToBin 


;保护 寄存 器 
:SI= 缓 冲 区 地 址 


:OF 缓冲 区 长 度 
:BE 存放 字符 的 缓冲 区 首 地 址 


== 接 收 键盘 输入 的 十 六 进 制 数 字符 串 


;取得 一 个 字符 
:依次 保存 


;继续 

二 = 转换 成 数值 

;OF 缓冲 区 长 度 

;BE 存放 字符 的 缓冲 区 首 地 址 
;DeE0 


:依次 取得 一 个 字符 


;转换 成 字符 对 应 的 数值 
;准备 合并 

;合并 到 一 起 

;继续 


AE 返回 值 ( 转换 结 困 


:恢复 被 保护 寄存 器 


功 能 : 把 一 位 十 六 进 制 数字 符 转 换 成 对 应 的 二 进 制 数值 


;入口 参数 : A= 十 六 进 制 数字 符 
:出口 参 数 : A= 对 应 二 进 制 数值 


说 明 : 如 非 十 六 进 制 数字 符 , 返 回 0 


E 
EE 
产 


3 


;把 '0”'9' 的 字符 转 成 对 应 数值 


可 能 小 写字 母 转 成 大 写字 母 
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SB AL 'A-10 :把 IAA” 'F' 的 字符 转 成 对 应 数值 


MW 人 AL 0 :无效 字符 ,默认 值 


; 子 程序 名 : EdhuBin 
; 功 ”能 : 二 进 制 数 形式 显示 8 位 二 进 制 值 
:入口 参数 : 和 二 进 制 数 


:出口 参数 : 无 
EchoBin: 
MY DOA 
MW C8 ;8 位 二 进 制 ,循环 8 次 
LL1@ EchoBin: 
RL om 1 :依次 移出 一 位 到 进位 标志 0F 
MV DL '0' :假设 为 0 
AD D0 ;考虑 实际 值 
CAL PutOnar ;显示 一 个 字符 
LOP LL1@ EchoBin ;继续 
RET 


功 能 : 显示 字符 串 
;人 口 参数 : 吧 : 吃 字符 串 首 地 址 


出口 参数 : 无 

;说 明 : 字符 串 以 0 作为 结束 标志 

EchoWess: 
RSH BX ;保护 寄存 器 区 
WwW Bm 

LL1@ EchoMess: 
WW DL [EM ;取出 待 显示 字符 
INC Bx :依次 
mR DD :是否 结束 符 ? 
由 LU2a Echoyess 是 , 转 结束 
CAL PutChar : 否 , 则 显示 
JP ”SHORT LLI@ Echoess ;继续 

L122 EchoWess: 
POP 改 恢复 寄存 器 区 
FET ;返回 

浮 程 序 名 : NewLine 

: 功 能 : 显示 输出 回 车 换行 

;出 入 参数 : 无 

NewLine: 


MW 2 :2 号 系统 功能 





MV DL OH ; 回 车 符 
INT 2H ;显示 输出 回 车 
MV DL OH 闹 行 符 
INT 2H ;显示 输出 换行 
RET ;返回 

子 程序 名 : GetChar 

功 能 : 从 键盘 读 一 个 键 

;人 口 参 数 : 无 

;出 口 参数 : A= 所 读 键 的 ASCII 码 

GetChar: 
WwW M1 
INT 2H ;调用 1 号 系统 功能 键盘 输入 
FET 

浮 程 序 名 : PRutChar 


功 能 : 显示 输出 一 个 字符 
;人 口 参数 : poL= 显示 输出 字符 ASCINI 码 


;出 口 参数 : 无 
PutChar: 
MY M2 
INT 21H ;调用 2 号 系统 功能 显示 输出 
FET 
;常量 声明 部 分 
BFEN equ 4 
数据 部 分 
mess1 中 "Segment xxooH) :" ,0 ;提示 字符 串 
mss2 db "Offset xxooH) :" ,0 ;提示 字符 串 
buffer gd BFE 输入 缓冲 区 长 度 
resbBUFFLEN 输入 缓冲 区 
addrSeg dy 0 ;存放 指定 的 存储 单元 段 值 
addrDisp dw 0 在 放 指 定 的 存储 单元 偏 移 





在 上 述 汇 编 语言 源 程序 中 , 子 程序 GetHex 接收 由 键盘 输入 的 十 六 进 制 数 , 并 转换 成 对 应 
的 二 进 制 值 。 为 了 简化 ,没有 处 理 非法 输入 的 情形 ,相反 要 求 输入 指定 个 数 的 字符 。 首 先 把 输 
和 人 的 字符 依次 保存 到 缓冲 区 ,然后 再 把 保存 在 缓冲 区 中 的 十 六 进 制 数字 串 转 换 成 对 应 的 数值 。 
该 子 程序 使 用 的 缓冲 区 的 首 字 节 含有 缓冲 区 的 有 效 长 度 ( 字 节 数 ), 随 后 的 空间 才 用 于 存放 输 
入 的 字符 信息 。 

对 NASM 汇编 器 而 言 ,在 源 程序 中 出 现 的 标号 或 者 名 称 , 它 们 代表 存储 单元 的 偏 移 。 如 
果 要 存 取 对 应 存储 单元 的 内 容 ,必须 把 相应 标号 或 者 名 称 放 在 一 对 方 括号 中 。 

上 述 程序 dp63. asm 只 有 一 个 段 ,而 且 起 始 偏 移 从 100H 开始 。 这 样 安排 后 ,利用 汇编 器 
NASM, 可 以 直接 生成 一 个 COM 类 型 的 可 执行 程序 。 如 果 文 件 的 扩展 名 为 . com, 那 么 在 控制 
台 窗 口中 ,就 可 以 直接 运行 它 。 
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【 例 6-38】 如 下 程序 dp64. asm, 演 示 根 据 用 户 的 选择 调用 对 应 的 子 程序 。 

演示 程序 dp64 的 执行 流程 为 : 提示 用 户 选择 输入 字母 D.H、O 〇 或 Q 之 一 ; 随后 接收 用 户 
键盘 输入 ; 然后 根据 输入 的 字母 确定 对 应 子 程序 的 序号 ,如 果 为 非法 字母 ,直接 结束 ; 最 后 调 
用 对 应 的 子 程序 。 


segment code :声明 段 code 开 始 
org 10H ;现在 以 10H 作 为 段 内 偏 移 
JWP begin ; 跳 转 到 begin 处 

kewal 中 0 。 

keytab 中 "pDdH0ogq" ;有 效 字符 串 

KEVLRN equ $- keytab ;符号 常量 (有 效 字 符 串 长 岛 


prampt 中 " select DHD9) : $" 
newl ine 中 OH OH 24 


entrytab dy SUBDD, SUBHHL SuBQQ SUBQQ 浮 程 序 人 口 地 址 表 


ba 
WW A GS 
MV Ds ;数据 段 同 代码 段 
MW ES 以 ;附加 段 同 代码 段 
MY DX prampt 
W AMM9 
INT 2IH ;显示 提示 信息 
WY A1 
INT 2IH ;接受 用 户 按键 
MY [kewal], AL ;保存 到 变量 keywal 
WN DX, newline 
W M9 
INT 2H ;输出 回 车 换行 
WY AL [kewal] ;取出 刚 保存 的 字符 
WwW CC KARN ;有 效 字 符 个 数 
MV DI, keytab ;准备 利用 字符 串 扫描 指令 
QD 
REPNZ SOASB 浏 断 用 户 输入 字符 是 否 有 效 
JZ oer ;用 户 输 入 无 效 的 字母 , 转 结束 
WY/ EX KE 1 ;准备 计算 字母 在 有 效 字符 串 中 的 索引 
SB BC 代为 字母 在 有 效 字 符 串 中 的 索引 
AD BX OH {01) =0|(23) =2|(45) =4|(67 =6 
COAL [BX entrytab] ; 闻 接 调用 对 应 的 子 程序 
Over : 
WW A 40H 
INT 2IH ;结束 程序 ,返回 操作 系统 





SUBHH: 显示 一 条 信息 
MV DX messageHH 
W M9 
INT 2IH 
FET 
messagetH db ”This is subroutine HH" ,CH OH 24 
SUBQQ: ;以 八进制 数 形式 ,显示 当前 位 置 的 偏 移 
MV AS$ ;取得 当前 位 置 的 偏 移 值 
PUSH BX ;保存 寄存 器 也 
MY BX messageg9 :BE 显示 信息 串 首 地 址 ( 偏 移 ) 
WwW DA 
XR ALA 
RL D1 ;单独 处 理 最 高 位 
A AL '0 ;转换 为 对 应 的 ASCNI 码 
MV [EX],AL ;保存 到 显示 信息 串 首 
in BX 
MV C5 ;准备 循环 5 次 (3 位 * 打 1 位 ) 
.NEXT: 
RL 以 3 ;一 个 八进制 位 对 应 3 个 二 进 制 位 
WwW ALD 
AD ALOH 
AD A,'0' ;转换 为 对 应 ASCNI 码 
WW [BEd],A ;依次 保存 到 显示 信息 串 中 
IN Bx 
LOOP .NET ;循环 5 次 
MY DX messagelQ ;输出 信息 串 首 地 址 
MV Ah9 
INT 21H ;显示 信息 串 
POP BX 恢复 寄存 器 也 
FET 


在 上 述 汇编 语言 源 程序 中 ,只 有 子 程序 SUBQQ 稍 复杂 , 它 实现 以 八进制 数 的 形式 ,显示 
该 子 程序 人 口 处 的 偏 移 。 

从 上 述 程序 可 知 ,程序 的 数据 部 分 被 安排 在 程序 的 开始 位 置 。 为 此 ,首先 利用 一 条 无 条 件 
转移 指令 跳 过 这 些 数据 。 

上 述 程序 只 有 一 个 段 ,而 且 起 始 偏 移 从 100H 开始 。 这 样 安排 后 ,利用 汇编 器 NASM 能 





够 容易 地 把 它 汇编 生成 COM 型 可 执行 程序 。 


6.5 段 声 明和 段 间 转移 


通常 一 个 程序 可 以 含有 多 个 段 ,不仅 代码 和 数据 可 以 各 自 独立 ,而且 根据 需要 不 同 功 能 的 
代码 也 可 以 占用 不 同 的 段 。 本 节 将 介绍 汇编 器 NASM 的 段 声明 语句 ,还 进一步 介绍 ITA-32 系 
列 CPU 的 段 间 转移 指令 。 


6.5.1 段 声 明 语句 


段 声 明 语句 属于 指示 语句 。 它 指示 (通知 ) 汇 编 器 ,开始 一 个 新 的 段 或 者 从 当前 段 切 换 到 
另 一 个 段 。 严 格 地 讲 ,程序 员 使 用 的 段 声明 语句 是 一 个 预定 义 的 宏 。 
段 声明 语句 的 一 般 格式 如 下 : 
SECTIN 段 名 [ 段 属性 ] ;注释 
其 中 , 段 名 给 出 段 的 名 称 ,作为 一 个 段 的 标识 符 。 段 属性 进一步 表示 段 的 性 质 , 可 以 默认 , 它 与 
目标 文件 的 格式 相关 ,用 到 时 再 具体 介绍 。 
为 了 方便 使 用 ,NASM 还 提供 了 另 一 个 等 价 的 段 声明 语句 ,形式 如 下 ; 
SEENT 段 名 [ 段 属性 ] ;注释 
两 个 段 声明 语句 仅 是 关键 词 不 同 ,作用 完全 相同 。 
在 本 章 前 面 的 几 个 演示 程序 中 ,都 采用 了 第 二 种 形式 。 
【 例 6-39】 演示 段 声明 语句 的 使 用 。 如 下 程序 dp65. asm, 在 经 过 汇编 和 链接 后 形成 一 个 
EXE 类 型 的 可 执行 程序 。 





section code 疡 明 段 ode 
.. start: :由 标号 ..start 指定 执行 起 点 

WW A data 

WW Ds ;BB 用 于 数据 段 

MY DX hello 

CAL Print str ;显示 提示 信息 

WW A 40H 

INT 21H ;结束 程序 ,返回 操作 系统 
Over : 

sectio data 疡 明 段 data 


sectio code ;恢复 到 段 code 


在 上 述 汇编 语言 源 程序 中 三 次 使 用 了 段 声明 语句 。 第 一 次 声明 开始 一 个 名 为 code 的 段 ; 
第 二 次 声明 开始 一 个 名 为 data 的 段 ; 第 三 次 声明 切换 回 到 code 的 段 。 在 第 三 次 声明 一 个 段 
时 ,由 于 段 名 与 前 面 的 段 名 code 相同 ,因此 并 不 新 建 一 个 段 ,而 是 先前 同名 段 的 继续 。 这 就 意 
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味 着 , 子 程序 Print_str 的 代码 紧 接 在 先前 的 指令 之 后 ,在 这 里 标号 over 所 表示 的 有 效 地 址 与 
标号 Print_str 所 表示 的 有 效 地 址 相同 。 
在 Windows 控制 台 窗 口中 ,利用 如 下 汇编 和 链接 命令 ,可 以 由 源 程序 dp65. asm 生成 可 
执行 程序 dp65. exe: 
NSM dk5am- f obj — o dpé5 obj 
LINK dpé5; 


当然 ,这 仅仅 是 一 个 用 于 说 明 段 声明 语句 的 示例 。 该 示例 程序 也 不 同 于 dp61. asm。 
6.5.2 无 条 件 段 间 转移 指令 


在 3. 3. 2 节 中 介绍 了 无 条 件 转移 指令 ,当时 的 重点 是 段 内 转移 。 现 在 进一步 介绍 无 条 件 
段 间 转移 指令 ,确切 地 说 是 实 方式 下 的 无 条 件 段 间 转移 指令 。 保 护 方式 下 的 无 条 件 段 间 转移 
指令 ,将 在 第 9 章 中 具体 介绍 。 

在 实 方式 下 , 段 内 偏 移 只 有 16 位 ,指令 指针 寄存 器 EIP 只 有 低 16 位 的 IP 起 作用 ,堆栈 指 
针 寄存 器 ESP 也 只 有 低 16 位 的 SP 起 作用 。 

与 无 条 件 段 内 转移 指令 相 比 ,无 条 件 段 间 转 移 指令 不 仅 设置 IP, 而 且 重 新 设置 代码 段 寄 
存 器 CS。 由 于 重 置 CS, 因 此 转移 后 继续 执行 的 指令 在 另 一 个 代码 段 中 。 

类 似 于 无 条 件 段 内 转移 指令 , 按 给 出 转移 目的 地 址 的 不 同方 式 ,无 条 件 段 间 转移 同样 可 分 
为 直接 转移 和 间接 转移 两 种 。 

1. 无 条 件 段 问 直接 转移 指令 

【 例 6-40】 演示 无 条 件 段 间 直接 转移 指令 的 使 用 。 如 下 程序 dp66. asm 含有 3 个 代码 段 
和 一 个 数据 段 ,在 经 过 汇编 和 链接 后 形成 一 个 EXE 类 型 的 可 执行 程序 。 


sectio codeA ;开始 段 codeA 
.start: ;执行 起 点 ( 由 标号 ..start 指 荐 

WW A data ;取得 data 段 的 段 值 

WW DS 人 ;设置 只 

MV DL [flagch] 

MV M2 

INT 21H ;显示 标记 字符 A 

JP codeB:step2 : 段 间 转 移 到 oodeB 段 的 step2 处 //@1 
step4: 

MV DL [flagch] 

MV Ah 2 

INT 2H ;显示 标记 字符 A 

WwW A 40H 

INT 2H ;结束 程序 ,返回 操作 系统 

sectio data aligF 16 ;开始 段 data 


flagch ”中 ”ABC” 
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section codeC aligF 16 ;开始 段 codeC 
step3: 
MV DL [flagcht2] 
W Ah2 
INT 2H ;显示 标记 字符 C 
JWP FMR step4 自 间 转移 到 codeA 段 的 step4 处 Me2 
section codB aligF 16 ;开始 段 codeB 
Step2: 
MV DL [flagcht]] 
MV Ah2 
INT 21H ;显示 标记 字符 B 
JWP ”codeC:step3 疲 间 转移 到 codeC 段 的 step3 处 Me3 


在 运行 对 应 的 可 执行 程序 时 ,屏幕 显示 信息 “ABCA”。 上 述 程序 从 codeA 段 内 的 . . start 
处 开始 执行 , 先 设 置 数据 段 的 段 值 ,并 显示 标记 字符 A, 之 后 就 利用 段 间 转 移 指令 跳 转 到 
codeB 段 内 的 step2 处 ; 在 codeB 段 内 ,只 是 显示 标记 字符 B, 随 后 就 跳 转 到 codeC 段 内 的 
step3 处 ; 在 codeC 段 内 ,也 是 显示 标记 字符 C, 接 着 就 跳 转 回 codeA 段 内 的 step4 处 ; 在 
codeA 段 内 ,显示 标记 字符 A, 最 后 结束 程序 。 当 然 , 这 仅仅 是 一 个 演示 程序 。 

在 上 述 声 明 段 开始 的 section 语句 中 ,“align 二 16” 表 示 段 开始 边界 地 址 为 16 的 倍数 ,这 是 
一 种 段 属性 。 

在 上 述 程序 dp66. asm 中 ,使 用 了 3 次 无 条 件 段 间 转移 指令 ,而 且 都 是 直接 转移 ,参见 源 
程序 注释 带 //@ 的 行 。 

无 条 件 段 间 直接 转移 指令 的 格式 如 下 : 

JP WE :AH 

段 名 SNAME 和 标号 LABEL 用 于 表示 转移 的 目标 位 置 或 者 转移 的 目的 地 。 其 中 , 段 名 
SNAME 给 出 转移 目标 段 ,标号 LABEL 给 出 转移 目标 段 内 的 偏 移 。 

汇编 器 NASM 还 支持 类 型 符 FAR 和 NEAR, 用 于 表示 标号 的 远近 ,或 者 转移 目标 的 远 
近 。 利 用 类 型 符 FAR ,表示 远 标 号 ,明确 要 求 采 用 段 间 转 移 指令 。 这 样 书写 时 可 以 省 略 段 名 ， 
见 上 述 程序 dp66. asm 中 注释 带 //@2 的 行 。 

如 果 使 用 类 型 符 FAR, 那 么 无 条 件 段 间 直 接 转 移 指 令 的 格式 如 下 所 示 : 

Jp FR ME 

实 方式 下 的 无 条 件 段 间 直接 转移 指令 的 对 应 机 器 指令 ,由 操作 码 和 目标 地 址 两 部 分 组 成 ， 
其 格式 如 图 6. 6 所 示 。 在 操作 码 之 后 ,首先 是 目标 的 段 内 偏 移 , 然 后 是 目标 所 在 段 的 段 值 。16 
位 的 偏 移 在 低地 址 ,16 位 的 段 值 在 高 地 址 。 因 为 指令 中 直接 含有 转移 目标 地 址 ,所 以 称 为 直 
接 转移 。 





操作 码 OP 偏 移 段 值 | 














图 6.6 无 条 件 段 间 直接 转移 指令 机 器 码 的 格式 
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在 实 方式 下 执行 无 条 件 段 间 直接 转移 指令 时 ,把 指令 中 所 带 的 段 值 送 到 代码 段 寄 存 器 
CS, 同 时 把 偏 移送 到 指令 指针 寄存 器 IP, 从 而 实现 段 间 转移 。 


2. 无 条 件 段 间 间 接 转 移 指 令 


所 谓 间 接 转移 ,就 是 转移 指令 并 不 直接 含有 转移 目标 的 地 址 。 


【 例 6-41] 


演示 无 条 件 段 间 间接 转移 指令 的 使 用 。 如 下 程序 dp67. asm 含有 两 个 代码 段 


和 一 个 数据 段 ,在 经 过 汇编 和 链接 后 形成 一 个 EXE 类 型 的 可 执行 程序 。 


data aligF 16 


和 


DL [flagch] 
Ah 2 
2H 


section codeB aligF 16 


MV DL [flagcht 1] 


人 2 


;开始 段 data 
标号 step2 的 偏 移 
;标号 step2 所 在 段 的 段 值 
;标号 step3 的 偏 移 
;标号 step3 所 在 段 的 段 值 
;标记 字符 串 


;开始 段 codeA 
沁 动 点 ( 由 标号 ..start 给 做 


;设置 数据 段 的 段 值 


;显示 标记 字符 a 


: 自 间 转移 到 codeB 段 的 step2 处 al 


;显示 标记 字符 a 


;结束 程序 ,返回 操作 系统 


;开始 段 codeB 


;显示 标记 字符 b 


;取得 存放 转移 目标 地 址 的 存储 单元 的 偏 移 
自 间 转移 到 codeA 段 的 step3 处 Ma2 


运行 经 过 汇编 和 链接 形成 的 可 执行 程序 .屏幕 显示 信息 "aba”。 


从 上 述 程序 可 知 ,在 数据 段 data 中 安排 


了 指针 变量 ptnext2 和 ptnext3 ,用 于 保存 转移 目 


标 处 step2 和 step3 的 地 址 ,而且 地 址 由 偏 移 和 段 值 两 部 分 构成 。 在 实 方式 下 ,类 似 这 样 的 指 
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针 变 量 应 该 是 双 字 变量 。 为 了 方便 设置 初 值 , 所 以 在 程序 中 把 每 个 指针 变量 分 解 成 两 个 字 变 
量 ,一 个 字 存 放 偏 移 , 另 一 个 字 存 放 段 值 。 

在 上 述 程序 执行 过 程 中 ,利用 指令 “JMP FAR [ptnext2]”, 跳 转 到 codeB 段 内 的 step2 
处 ; 利用 指令 “JMP FAR [BX]” 跳 转 到 codeA 段 内 的 step3 处 。 见 注释 中 带 //@ 的 行 。 当 
然 ,这 仅仅 是 一 个 演示 程序 。 

无 条 件 段 间 间 接 转 移 指令 的 格式 如 下 : 

Jp FR 0m 

其 中 ,在 实 方式 下 操作 数 OPRD 应 该 是 一 个 双 字 存储 单元 。FAR 是 类 型 符 , 明 确 表示 段 间 转 
移 ( 远 转移 )。 该 指令 把 双 字 存储 单元 OPRD 中 的 一 个 字 ( 高 地 址 的 字 ) 作 为 16 位 的 段 值 送 到 
代码 段 寄存 器 CS, 把 双 字 中 的 另 一 个 字 ( 低 地 址 的 字 ) 作 为 16 位 的 偏 移送 到 指令 指针 寄存 器 
IP, 从 而 实现 转移 。 

存储 器 操作 数 OPRD 可 以 采用 各 种 存储 器 寻 址 方式 。 


6.5.3 段 间 过 程 调用 和 返回 指令 


在 3.5.3 节 中 介绍 了 过 程 调用 指令 和 过 程 返回 指令 ,当时 的 重点 是 段 内 调用 和 返回 。 现 
在 进一步 介绍 段 间 过 程 调用 指令 和 返回 指令 ,确切 地 说 是 实 方式 下 的 段 间 过 程 调用 和 返回 。 
关于 保护 方式 下 的 段 间 过 程 调 用 和 返回 指令 ,将 在 第 9 章 中 介绍 。 
在 实 方式 下 ,过 程 ( 子 程序 ) 的 和 人口 地 址 的 段 内 偏 移 只 有 16 位 ,当然 返回 地 址 的 段 内 偏 移 
也 只 有 16 位 。 
1. 段 间 过 程 调用 指令 
如 前 所 述 ,与 无 条 件 转移 指令 JMP 相 比 ,过 程 调用 指令 CALL 会 把 返回 地 址 压 人 堆栈 ， 
其 他 方面 都 是 相似 的 。 段 间 过 程 调用 指令 ,会 把 返回 地 址 (包括 段 值 和 偏 移 两 部 分 ) 压 人 堆栈 ， 
剩余 的 与 无 条 件 段 间 转移 指令 相似 。 
段 间 过 程 直接 调用 指令 的 格式 如 下 : 
OL WE :LAH 
其 中 , 段 名 SNAME 和 标号 LABEL 用 于 表示 子 程序 的 入 口 地 址 。 段 名 SNAME 给 出 子 程 序 
所 在 段 ,标号 LABEL 给 出 子 程序 的 段 内 偏 移 。 
可 以 使 用 类 型 符 FAR, 其 格式 如 下 : 
OL FR MH 
这 仅仅 是 书写 形式 的 不 同 ,机 器 指令 完全 相同 ,机 器 码 的 格式 也 与 图 6. 6 所 示 类 似 。 
在 实 方式 下 执行 上 述 指令 时 ,首先 把 返回 地 址 的 段 值 和 偏 移 压 入 堆栈 ,然后 把 指令 中 所 带 
的 段 值 送 到 CS, 同 时 把 偏 移送 到 IP, 从 而 转移 到 子 程序 。 
段 间 过 程 间接 调用 指令 的 格式 如 下 : 
OL FR oD 
其 中 ,在 实 方式 下 操作 数 OPRD 应 该 是 一 个 双 字 存储 单元 。 在 实 方式 下 执行 该 指令 时 ,首先 
把 返回 地 址 的 段 值 和 偏 移 压 人 堆栈 ,然后 把 双 字 存储 单元 OPRD 中 的 一 个 字 ( 高 地 址 的 字 ) 作 
为 16 位 的 段 值 送 到 CS, 把 双 字 中 的 另 一 个 字 ( 低 地 址 的 字 ) 作 为 16 位 的 偏 移 送 到 IP, 从 而 转 
移 到 子 程序 。 
在 实 方式 下 ,执行 段 间 过 程 调 用 指令 时 ,堆栈 的 变化 如 图 6.7(a)、(b) 所 示 , 返 回 地 址 的 段 
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值 和 偏 移 各 占 两 个 字 节 。 
堆栈 底部 堆栈 底 冰 SS 
SP R 
返回 地 址 段 值 
一 > Sp__。 | 返回 地 址 偏 移 
(a) 调用 前 的 堆栈 (b) 调用 后 的 堆栈 (c) 返回 后 的 堆栈 


6.7 实 方式 下 段 间 过 程 调用 堆栈 变化 示意 图 


2. 段 间 过 程 返回 指令 
与 段 间 过 程 调用 指令 相对 应 ,还 有 段 间 过 程 返回 指令 ,用 于 从 远 过 程 返 回 。 
段 间 过 程 返回 指令 的 格式 如 下 : 
FREEF 
可 见 ,该 指令 助 记 符 比 段 内 过 程 返 回 指令 RET 多 了 一 个 字母 F, 以 此 表示 远 返 回 。 
在 实 方式 下 执行 该 指令 时 ,从 堆栈 先后 弹出 返回 地 址 的 偏 移 和 上 段 值 ,分 别 送 到 IP 和 CS， 
从 而 实现 过 程 ( 子 程序 ) 的 段 间 返 回 。 堆 栈 的 变化 如 图 6.7(b)、(e) 所 示 。 
还 有 段 间 带 立 即 数 过 程 返回 指令 。 
段 间 带 立 即 数 过 程 返回 的 格式 如 下 ,其 中 count 是 一 个 16 位 的 立即 数 。 
FETF count 
该 指令 在 实现 段 间 返 回 的 同时 ,再 额外 根据 count 值 调整 堆栈 指针 。 在 实 方式 下 具体 操作 
为 , 先 从 堆栈 弹出 返回 地 址 的 偏 移 和 段 值 (当然 ,会 调整 堆栈 指针 SP) ,再 把 count 加 到 SP 上 。 
【 例 6-42】 演示 段 间 过 程 调用 和 返回 指令 的 使 用 。 如 下 程序 dp68. asm 有 3 个 代码 段 ， 
在 经 过 汇编 和 链接 后 形成 一 个 EXE 类 型 的 可 执行 程序 。 


sectio codeA aligF 16 ;开始 段 codeA 
.start: ;启动 点 
MV MG 
WW Ds Mx ;使 得 当前 数据 段 同 代码 段 
NV AX ooded :取得 oode0 自 的 段 值 
CAL FAR [ptsubr] ;间接 调用 远 过 程 ,显示 上 述 段 值 
WW oL ah :形成 回 车 和 换行 
CAL codeC:PutOnar :直接 调用 远 过 程 
WW DL OH 
CAL codeC:PutOnar :直接 调用 远 过 程 
Wy SI，ptsubr 指向 ptsubr 双 字 存储 单元 
MV ”以 codeB ;取得 codeB 段 的 段 值 
CL FR [SOD ;间接 调用 远 过 程 ,显示 上 述 段 值 
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MY A 40H 
INT 2H ;结束 程序 ,返回 操作 系统 
ptsubr dy echo4 浮 程 序 echo4 的 段 内 偏 移 
dy codeB 浮 程 序 echo4 所 在 段 的 段 值 
sectiom codB aligF 16 ;开始 段 codeB 
ToAsC11: ;把 中 的 低 4 位 转换 成 
AD DL OH 盖 位 十 六 进 制 数 的 ASCN 码 
AD DL '0 
QP  DL '9' 
JE lb 
AD D7 
lab:RET 段 内 返回 
echo4: ;采用 4 位 十 六 进 制 数 形 式 
WW C4 ;显示 以 中 的 6 位 值 
WwW BA 
next: 
RL BX4 
WwW DE 
CAL ToAscll 
CAL codeC:PutOhar ;调用 远 过 程 ,显示 一 位 十 六 进 制 数 
LOP next 
WwW Di'H 
CAL codeC:PutOnar ;调用 远 过 程 ,显示 字符 
RETF : 段 间 返 回 
section codeC aligF 16 ;开始 段 codeC 
PutChar: ;显示 咏 中 的 字符 
MV Ah 2 
INT 21H 
RETF : 段 间 返 回 


从 上 述 程序 可 知 ,在 段 codeA 中 ,两 次 调用 段 codeB 中 的 子 程序 echo4 ,分 别 显示 运行 时 
的 段 codeC 和 codeB 的 段 值 。 这 两 次 段 间 调 用 ,都 采用 了 间接 调用 的 方式 。 为 了 充分 演示 段 
间 调 用 指令 的 使 用 ,把 子 程序 echo4 的 入 口 地 址 ( 段 值 和 偏 移 ) 以 初 值 的 形式 ,安排 在 双 字 存储 
单元 ptsubr 中 。 在 间接 调用 时 ,还 刻意 采用 了 不 同 的 寻 址 方式 来 指定 双 字 存储 单元 ptsubr。 

主 程序 和 子 程序 echo4, 还 多 次 调用 段 codeC 中 的 子 程序 PutChar 显示 字符 。 这 些 段 间 
调用 都 采用 了 直接 调用 的 方式 。 


6.6 目标 文件 和 段 模 式 


目标 文件 的 主体 是 对 应 源 程序 的 目标 程序 , 即 机 器 指令 和 数据 。 为 了 在 发 展 的 同时 保持 
兼容 ,IA-32 系列 CPU 支持 32 位 段 和 16 位 段 两 种 段 模式 。 本 节 简 要 说 明 目 标 文 件 的 组 成 ， 
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同时 介绍 声明 段 模式 的 语句 。 
6.6.1 目标 文件 


汇编 器 把 汇编 源 程 序 翻译 成 目标 程序 ,对 应 文件 称 为 目标 文件 。 链 接 器 把 若干 个 目标 程 
序 和 库 函 数 等 链接 到 一 起 ,形成 可 执行 程序 ,对 应 文件 称 为 可 执行 文件 。 通 常 ,目标 文件 和 可 
执行 文件 不 仅 含 有 程序 的 代码 和 数据 ,而 且 还 会 含有 运行 程序 所 需要 的 其 他 信息 ,如 程序 执行 
的 起 始 位 置 ,又 如 程序 的 分 段 信息 等 。 不 同 的 操作 系统 ,对 可 执行 文件 的 格式 有 不 同 要 求 。 为 
了 满足 不 同 要 求 ,有 多 种 不 同 格式 的 目标 文件 。 这 些 不 仅 与 操作 系统 有 关 ,也 与 汇编 器 和 链接 
器 有 关 。 

汇编 器 NASM 能 够 生成 纯 二 进 制 目标 文件 :也 能 生成 obj 格式 的 目标 文件 ,还 能 生成 
win32 格式 目标 文件 .coff 格式 目标 文件 和 elf 格式 目标 文件 等 。 

下 面 结合 纯 二 进 制 目标 文件 和 obj 格式 目标 文件 ,简要 介绍 目标 文件 的 构成 ,同时 说 明 为 
了 生成 不 同 格式 的 目标 文件 ,对 源 程序 的 不 同 要 求 和 支持 。 

1. 纯 二 进 制 目标 文件 

纯 二 进 制 目标 文件 其 实 称 不 上 目标 文件 。 事 实 上 , 它 只 含有 对 应 源 程序 的 二 进 制 代 码 , 即 
二 进 制 形式 的 机 器 指令 和 数据 ,并 不 含有 其 他 信息 。 纯 二 进 制 目标 文件 有 时 很 有 用 ,尤其 在 没 
有 操作 系统 的 场合 ,从 第 7 章 开 始 将 频繁 使 用 纯 二 进 制 文件 。 

如 果 不 指定 输出 格式 或 者 输出 格式 为 bin 时 ,汇编 器 NASM 生成 纯 二 进 制 目标 文件 ,也 
就 是 把 汇编 源 程序 文件 翻译 成 纯 二 进 制 文件 。 

【 例 6-43】 观察 纯 二 进 制 目标 文件 。 假 设 有 如 下 作为 示例 的 汇编 源 程序 dp69. asm。 


section oode 
begin: 
WY A begin ;把 标号 begin 代 表 的 偏 移送 到 从 , AE 0000H 
MW AX$ ;把 当前 偏 移送 到 AX, AX= 0008H 
lab1: 
WW A134H ;把 1B4H 送 到 俯 ,AE 1234 
lab2: 
JP short lab2 跳 转 到 自己 ( 构成 无 限 循环 ) 


warl 。 dy al lab2 。 。 症 义 两 个 字 变量 , 初 值 是 lsb1 和 la 代表 的 偏 移 
Ma :定义 一 个 字 变量 , 初 值 是 war1 代 表 的 偏 移 


采用 如 下 汇编 命令 ,可 生成 只 有 17 个 字 节 的 纯 二 进 制 文件 : 
nsm dam - fbin - od 
为 了 便于 阅读 ,分 行 显示 ,每 行 以 分 号 作为 分 隔 符 。 第 1 列 是 用 十 六 进 制 数 表 示 的 机 器 码 
或 者 数据 的 字 节 值 ,这 是 二 进 制 文件 真正 的 内 容 ; 第 2 列 是 对 应 源 代码 ,这 是 为 了 阅读 理解 添 
加 上 去 的 ; 第 3 列 是 对 应 行 代码 开始 的 偏 移 , 也 是 为 了 阅读 理解 添加 上 去 的 ,采用 十 六 进 制 
表示 。 


BOO MV AX begin ; 0000 
BBO :WV AX$ ; 0008 
B312 :NN AX 1234H ; 0000 
世故 JP short lab2 ; 0009 





0000 ;dy labl lab2 ; OB 
Bo ;dy warl ; OOF 
在 阅读 上 述 文 件 内 容 时 ,请 注意 操作 数 存 放 的 “高 高 低 低 ”规则 。 
从 上 述 文 件 内 容 可 知 ,“B8” 是 对 应 MOV 指令 的 操作 码 ,操作 数 都 是 16 位 的 立即 数 ; 第 4 
行 无 条 件 转 移 指令 中 的 操作 码 是 “E9”, 其 后 是 8 位 的 地 址 差 值 OFEH ,也 就 是 -2。 
从 上 述 文件 内 容 还 可 以 清楚 地 看 到 标号 .名称 和 记号 所 代表 的 偏 移 值 。 
Windows 仍然 支持 以 纯 二 进 制 目标 文件 形式 存在 的 可 执行 程序 ,只 要 其 扩展 名 是 . com。 
为 了 运行 这 样 的 可 执行 程序 ,操作 系统 总 是 把 纯 二 进 制 文件 加 载 到 内 存 代码 段 的 偏 移 100H 
开始 处 ,执行 起 始点 偏 移 也 是 100H。 
为 此 ,汇编 器 NASM 支持 对 应 的 源 程序 含有 一 个 特别 的 汇编 指示 org, 由 它 指 示 段 的 起 
始 偏 移 。 起 始 偏 移 设 定语 句 的 格式 如 下 : 
org 表达 式 
其 中 ,表达 式 是 常数 表达 式 , 一 般 应 该 是 16 的 倍数 ,由 它 给 出 假设 的 起 始 偏 移 。 汇 编 器 
NASM 支持 的 org 请 句 与 有 些 汇编 器 不 同 。 
在 6.2 节 中 的 dp61. asm 和 6.4 节 中 的 dp64. asm 等 源 程序 中 ,都 安排 了 这 样 的 org 语 
句 , 由 它们 设 定 起 始 偏 移 。 
【 例 6-44】 观察 纯 二 进 制 目 标 文件 。 在 例 6-43 汇编 源 程序 dp69. asm 中 插入 起 始 偏 移 设 
定语 句 , 形 成 如 下 所 示 的 源 程 序 dp610. asm。 


section code ; 设 起 始 偏 移 10H 
org 100H 
begin: 
MV AX begin ;把 标号 begin 代 表 的 偏 移送 到 AX, As 0100H 
MV MAS$ ;把 当前 偏 移送 到 俯 , AE 0I09H 
labl: 
Ww A1234H ;把 BMH 送 到 以 ,AE 1234 
lab2: 
JP short lab2 ; 跳 转 到 自己 ( 构成 无 限 循环 ) 


warf dw labl, Iab2 定义 两 个 字 变 量 , 初 值 是 同和 12 代表 的 偏 移 


war2 dw warl ;定义 一 个 字 变量 , 初 值 是 war1 代 表 的 偏 移 
经 过 汇编 ,仍然 生成 只 有 17 个 字 节 的 纯 二 进 制 文件 ,具体 内 容 如 下 所 示 。 

B8001 ;MV AX begin ; 0000 

BBA MV A$ ; O08 

B412 :MY A 104 ; 000 

巴 夺 ; WP short lab2 ; 0009 

Bom dy labi, lab2 ; 000B 

Bq ;duw warl ; OOF 


从 上 述 内 容 中 可 以 看 到 标号 .名称 和 记号 所 代表 的 偏 移 值 。 与 前 一 个 纯 二 进 制 文件 的 内 
容 相 比 ,可 以 清楚 地 看 到 起 始 偏 移 设 定语 句 所 起 的 作用 。 第 3 列 是 代码 和 数据 在 二 进 制 目 标 
文件 中 的 实际 位 置 。 如 前 所 述 , 在 运行 时 程序 被 加 载 到 内 存 代码 段 100H 开始 处 ,这 样 就 完全 
= 

由 于 纯 二 进 制 目标 文件 不 含 其 他 信息 ,因此 在 对 应 的 源 程序 中 不 能 通过 段 名 来 引用 段 值 ， 
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也 不 能 使 用 返回 段 值 的 运算 符 seg。 

2. obj 格式 目标 文件 

obj 格式 目标 文件 适用 于 生成 EXE 类 型 的 可 执行 程序 。 在 早先 的 DOS 操作 系统 下 ,可 执 
行程 序 主要 是 EXE 类 型 ,还 有 部 分 是 COM 类 型 。 

在 6.2 节 中 的 dp62. asm 和 6.5 节 中 的 dp65. asm 等 源 程序 ,在 由 汇编 器 对 源 程 序 汇 编 后 
可 生成 obj 格式 目标 文件 ,在 由 链接 器 对 obj 格式 目标 文件 链接 后 ,可 以 生成 EXE 类 型 的 可 执 
行程 序 。 

obj 格式 目标 文件 不 仅 含有 对 应 源 程序 的 机 器 指令 和 数据 ,而 且 还 含有 其 他 重要 信息 。 
例如 ,支持 引用 段 值 的 信息 。 又 如 ,程序 开始 执行 位 置 的 信息 。 所 以 ,obi 格式 目标 文件 要 比 
纯 二 进 制 目标 文件 长 。 

在 用 于 生成 obj 格式 目标 文件 的 源 程序 中 , 段 名 代表 段 值 ,所 以 可 以 通过 段 名 来 引用 段 
值 。 还 可 以 利用 运算 符 seg 获取 标号 所 在 段 的 段 值 。 但 是 ,在 这 样 的 源 程序 中 ,不 能 安排 起 始 
偏 移 设 定语 句 org。 

另外 ,在 多 个 由 链接 器 链接 到 一 起 的 目标 文件 中 .有 且 只 能 有 一 个 目标 文件 含有 开始 执行 
的 位 置 。 程 序 开始 执行 的 位 置 ,在 源 程序 中 由 特定 的 标号 .. start 给 出 。 在 6. 5 节 中 dp65. 
asm 等 源 程序 中 ,都 安排 了 这 样 的 开始 执行 标号 。 


6.6.2 ”上段 模式 声明 语句 


无 论 是 保护 方式 还 是 实 方式 ,IA-32 系列 CPU 都 支持 8 位 、16 位 和 32 位 的 操作 数 ,都 支 
持 16 位 和 32 位 的 存储 器 寻 址 方式 。 为 了 保持 兼容 ,同时 保证 效率 ,IA-32 系列 CPU 支持 两 
种 段 模 式 , 即 32 位 段 模式 和 16 位 段 模 式 。 在 保护 方式 下 ,一 般 采 用 32 位 段 ; 在 实 方式 下 ,只 
能 使 用 16 位 段 。 

对 于 32 位 段 ,默认 的 操作 数 尺寸 是 8 位 和 32 位 ,默认 的 存储 器 寻 址 方式 是 32 位 。 与 之 
相反 ,对 于 16 位 段 ,默认 的 操作 数 尺 寸 是 8 位 和 16 位 ,默认 的 存储 器 寻 址 方式 是 16 位 。 

汇编 器 NASM 提供 了 段 模式 声明 语句 , 它 属 于 指示 语句 。 

段 模式 声明 诸 句 的 格式 如 下 : 

BITS 32 
BITS 人 16 

上 述 第 一 条 语句 指示 汇编 器 NASM 按 32 位 段 模 式 来 翻译 随后 的 代码 ; 而 第 二 条 语句 指 
示 按 16 位 段 模式 来 翻译 随后 的 代码 。 

在 大 多 数 情况 下 ,并 不 需要 显 式 地 声明 采用 16 位 段 还 是 32 位 段 , 汇 编 器 NASM 将 根据 
生成 目标 文件 的 格式 来 确定 默认 的 段 模 式 。 在 生成 纯 二 进 制 目标 文件 时 , 缺 省 按 16 位 段 处 
理 。 在 生成 obj 格式 目标 文件 时 ,也 默认 按 16 位 段 处理 。 

【 例 6-45】 如 下 程序 dp611. asm 演示 段 模式 声明 语句 的 使 用 ,其 中 注释 是 以 十 六 进 制 字 
节 值 形式 给 出 的 对 应 机 器 码 。 


segment text 
org 100H ; 设 起 始 偏 移 100H 
MV MG 


MV DX 





bits 16 :声明 16 位 段 模式 
WW AL1 B09 
MV 以 1 B00 
WwW EX1 ;的 始 01 0 0 0 
MWY 。 SI，war E5101 
WW ERX war 6BHNMOO 
MW A [SD ;BA 04 
WW 俯 [S ;名 04 
Ww EMX [SD] es: :0 
WwW A, [EX :AB 
MV A [EM :B88 
Ww EX [EM :8B8 
bits 2 ;声明 名 位 段 模式 
WW AL1 ;BO 0 
MV 有 俯 1 ;的 始 00 00 Ma 
MV Ex 1 ;B8 0 00 00 0 
MV Sl, war ;的 外 51 0 
MXM EX war ;BB 51 0 00 00 
WW AL [sO :AM 
WW AMX [SD :1 6BYU 
MV EMX [SO] :B04 
WwW A [EX BA 08 
MV AMX [EM 的 虹 08 
Ww EX [EM Br 
bits 16 疡 明 1 位 段 模式 
JP $ 四 钙 牛 
War dw 1234 ;3412 
dy 558H :BB% 


在 上 述 程序 中 ,有 一 个 显 式 声明 为 16 位 段 的 代码 片段 ,还 有 一 个 显 式 声明 为 32 位 段 的 代 
码 片段 。 为 了 便于 相互 比较 ,有 意 安 排 完 全 相同 的 汇编 格式 指令 。 比 较 上 述 以 注释 形式 给 出 
的 机 器 指令 可 以 发 现 ; 在 16 位 段 中 ,如 果 操 作 数 是 32 位 ,那么 机 器 指令 中 有 一 个 前 组 66H ， 
如 果 存 储 器 寻 址 方式 是 32 位 ,那么 有 一 个 前 级 67H; 在 32 位 段 中 的 情况 刚好 相反 ,如 果 操作 
数 是 16 位 ,那么 机 器 指令 中 有 一 个 前 级 66H ,如 果 存 储 器 寻 址 方式 是 16 位 ,那么 有 一 个 前 
级 67H。 

前 级 66H 称 为 操作 数 尺寸 前 级 ; 前 级 67H 称 为 存储 器 地 址 尺寸 前 级 ,简称 地 址 尺寸 前 
级 。 利 用 操作 数 尺寸 前 级 66H ,可 以 改变 默认 的 操作 数 尺寸 ; 利用 地 址 尺寸 前 级 67 了 HH, 可 以 改 
变 默 认 的 存储 器 地 址 尺寸 。 如 果 同 时 使 用 这 两 个 前 缀 ,那么 就 意味 着 同时 改变 默认 的 操作 数 
尺寸 和 存储 器 地 址 尺寸 。 

注意 ,上 述 程序 dp611. asm 仅仅 是 一 个 示例 , 它 貌似 可 以 被 汇编 成 一 个 COM 类 型 的 可 执 
行程 序 , 但 是 不 要 试图 真正 运行 它 。 因 为 ,在 实 方式 下 只 可 以 运行 16 位 段 的 程序 ,在 执行 到 
32 位 段 的 第 二 条 指令 (注释 带 //@) 时 ,会 出 现 严重 问题 。 事 实 上 ,该 指令 中 的 前 级 66H ,会 使 
得 实 方式 下 的 处 理 器 误 以 为 是 32 位 操作 数 , 相 当 于 指令 “MOV EAX, 01B80001H”, 也 就 是 
把 下 一 条 指令 的 代码 也 作为 当前 指令 的 操作 数 。 所 以 ,不 能 如 此 简单 地 混合 16 位 段 代码 和 
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32 位 段 代码 。 
一 般 情 况 下 ,不 需要 在 源 程序 中 使 用 操作 数 尺寸 前 级 和 地 址 尺寸 前 级 ,而 是 根据 需要 直接 
使 用 相应 的 操作 数 和 存储 器 寻 址 方式 。 在 汇编 过 程 中 ,汇编 器 将 根据 指令 中 操作 数 的 尺寸 及 
存储 器 地 址 尺寸 ,按照 当前 的 段 模式 ,自动 添加 相应 的 尺寸 前 级 。 就 像 上 述 dp611. asm 所 示 。 
在 特殊 情况 下 ,如 果 需 要 额外 插入 操作 数 尺寸 前 缀 或 者 地 址 尺寸 前 级 ,那么 可 以 使 用 汇编 
器 NASM 提供 的 前 组 符号 A32、A16、O32 和 016 ,它们 分 别 表示 地 址 尺寸 前 级 和 操作 数 尺 寸 
前 级 。 


时 


6.7 


所 谓 宏 ,就 是 用 一 个 符号 表示 多 个 符号 或 者 代码 片段 。 在 源 程序 中 使 用 宏 ,可 以 减少 重复 
书写 ,简化 源 程 序 ; 可 以 实现 整体 蔡 换 ,维护 源 程 序 。 汇 编 器 NASM 支持 多 行 宏和 单行 宏 。 
本 节 结 合 示 例 , 介 绍 宏 的 声明 和 使 用 。 


6.7.1 宏 指令 的 声明 和 使 用 


汇编 器 NASM 支持 的 多 行 宏 , 就 是 所 谓 的 宏 指令 。 在 使 用 宏 指令 之 前 ,必须 先 声 明 。 
1. 宏 指 令 的 声明 
安 指 令 的 声明 是 指 说 明 它 与 由 它 代表 的 多 个 符号 或 代码 片段 之 间 的 替代 关系 。 不 像 子 程 
序 ( 函 数 ) 的 定义 , 宏 指 令 的 声明 自身 不 占用 存储 空间 ,所 以 用 “声明 ”, 而 非 “定义 ”。 
汇编 器 NASM 支持 的 宏 指 令 的 声明 形式 如 下 : 
%nmacro 宏 指 令 名 参数 个 数 


% endracro 
其 中 ,%macro 和 %endmacro 是 一 对 汇编 指示 ,在 宏 声明 中 ,它们 必须 成 对 出 现 , 表 示 宏 声明 
的 开始 和 结束 。 在 %macro 和 %endmacro 之 间 的 内 容 是 宏 体 ,可 以 是 由 指令 、 伪 指令 和 宏 指 
令 构成 的 程序 片段 。“ 宏 指令 名 ”由 用 户 指定 ,适用 一 般 标号 命名 规则 。“ 参 数 个 数 ” 表 示 该 宏 
指令 使 用 的 参数 数量 ,简单 地 是 一 个 数值 ,但 也 可 以 比较 灵活 。 
【 例 6-46】 把 利用 系统 功能 调用 实现 接收 从 键盘 输入 一 个 键 的 代码 片段 声明 为 宏 指 令 。 
%macro GetChar 0 


MV Ah1 
INT 2IH 
% endmacro 


上 述 宏 指令 GetChar 没有 参数 ,由 两 条 指令 构成 。 
【 例 6-47】 把 利用 系统 功能 调用 实现 显示 输出 的 代码 片段 声明 为 宏 指 令 。 
%macro PutChar 1 


MW  DL%1 
WW Ah2 
INT 2IH 

% endracro 


上 述 宏 指令 PutChar 有 一 个 参数 ,在 宏 体 中 用 %1 表示 ,由 它 给 出 显示 字符 所 在 。 
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【 例 6-48〗 如 下 声明 的 宏 指令 MOVED, 把 一 个 双 字 存储 单元 的 内 容 送 到 另 一 个 存储 
单元 。 
%macro MND 2 
PUSH EX 
MW EM %2 
WY %1, EAX 
POP EX 
% endmacro 
上 述 宏 指令 MOVED 有 两 个 参数 ,在 宏 体 中 分 别 用 %1 和 %2 表示 。 第 2 个 参数 %2 代表 
源 ,第 1 个 参数 %1 代表 目标 。 利 用 寄存 器 EAX 来 过 渡 ,因此 通过 堆栈 保护 。 
2. 宕 指令 的 使 用 
在 声明 宏 指 令 后 ,就 可 使 用 宏 指 令 来 表示 对 应 的 程序 片段 ,这 称 为 宏 调 用 。 宏 调用 的 一 般 
格式 如 下 : 
宏 指令 名 参数 表 
一 般 来 说 ,参数 表 中 的 参数 个 数 应 该 与 声明 宏 指 令 时 一 致 。 但 是 ,有 时 也 可 以 不 一 致 。 
【 例 6-49】 演示 调用 例 6-46 的 宏 指 令 GetChar 和 例 6-47 的 宏 指 令 PutChar。 


GetOhar 

WW BA 
PutChar OH 
PutChar OWN 


在 对 源 程 序 汇 编 时 ,汇编 器 把 源 程序 中 的 宏 指 令 替换 成 对 应 的 宏 体 , 称 为 宏 展开 或 宏 扩 
展 。 上 述 程序 片段 在 汇编 时 得 到 的 实际 指令 片段 如 下 所 示 。 


MW AL1 <x1> 
INT 2IH > 
MV BA 

MW DL OH bps 
WwW AMH2 x1> 
INT 2H x1> 
MW DL ONH <1> 
MW Ah2 <1> 
INT 2IH <x1> 


注意 ,注释 是 添加 上 去 的 ,记号 <1> 表 示 宏 展开 所 得 ,以 示 区 别 。 
参数 使 得 宏 指 令 的 使 用 很 灵活 。 在 宏 展 开 时 ,参数 部 分 是 原样 替换 。 
【 例 6-50】 编写 一 个 程序 ,以 十 六 进 制 数 的 形式 显示 所 按键 的 ASCII 码 。 
在 6.2 节 中 的 例 6-11 演示 程序 dp62 实现 同一 功能 。 现 在 为 了 演示 宏 指 令 的 声明 和 使 
用 , 换 一 种 编写 形式 。 实 现 所 需 功 能 的 汇编 源 程 序 dp612. asm 如 下 ,为 节省 篇 幅 , 省 略 了 安 
GetChar 和 宏 PutChar 的 声明 。 
:此 处 安排 宏 Gatghar 和 Putchar 的 声明 
; 宏 TOASC: 把 十 六 进 制 数 转 成 对 应 字符 的 ASCN 码 
%macro TOASC 0 
AD AL OH 
AD A,'O' 





OP AL'9' 
JE SHORT$+4 有 哑 过 其 后 加 7 指令 
AD AL7 
% endmacro 
SECTIN TEXT ;开始 一 个 段 XT 
BITS 16 ;6 位 段 
ORG -10H :起 始 偏 移 10H 
begin: 
GetChar ;接受 一 个 键 
W BA 滥 时 保存 
PutChar (DH :形成 回 车 
PutOrar OM 形成 换行 
W AL 
SR AL4 ;得 到 高 4 位 
TOASC ;把 高 4 位 转换 成 对 应 ASCN 码 
PutChar AL ;显示 
WwW AB 
TOASC ;把 低 4 位 转换 成 对 应 ASCI 码 
PutChar AL ;显示 
WW Ah4H ;结束 返回 操作 系统 
INT 2H 


从 上 述 源 程序 可 知 ,还 声明 了 宏 指令 TOASC, 由 它 实 现 把 一 位 十 六 进 制 数 转换 成 对 应 字 
符 的 ASCII 码 。 
利用 汇编 器 NASM 汇编 处 理 上 述 源 程序 .可 以 直接 生成 一 个 二 进 制 代码 文件 ,并 形成 
COM 类 型 的 应 用 程序 。 
【 例 6-51】 演示 调用 例 6-48 中 声明 的 宏 指 令 MOVED。 假 设 有 如 下 的 宏 调 用 : 
MNED [ES ，[buffer+r ECXk 习 
那么 在 汇编 时 ,该 宏 指 令 将 展开 成 如 下 的 片段 : 
PUSH EM 
MX ”EAX [bufferr ECX+D 
WW [ESD, EX 
POP EX 
注意 宏 调用 时 的 参数 ,在 宏 展开 时 被 原样 替换 。 当 然 , 如 果 在 源 程序 中 没有 定义 buffer， 
那么 汇编 器 将 发 出 错误 提示 信息 。 
假设 有 如 下 的 宏 调 用 : 
MNED [EAX], [EBX] 
那么 在 汇编 时 ,上 面 的 宏 指 令 将 展开 成 如 下 的 片段 : 
PUSH EX 
Ww EX [EX 
WW [EM, EX 
POP EX 


第 6 章 ， 汇 编 语言 “261 





虽然 汇编 器 不 会 发 出 错误 提示 信息 ,但 将 导致 程序 发 生 严重 问题 。 实 际 上 ,在 例 6-48 中 
声明 的 宏 指 令 MOVED ,不 支持 以 [EAX] 作 为 第 一 个 参数 。 因 此 ,程序 员 应 该 了 解 所 使 用 的 
宏 指令 。 

3. 宏 指令 的 用 途 

(1) 简化 源 代码 。 若 在 源 程序 中 要 多 次 使 用 到 某 个 程序 片段 ,那么 可 以 把 该 程序 片段 声 
明 为 一 条 宏 指 令 。 此 后 ,在 需要 这 个 程序 片段 之 处 安排 一 条 对 应 的 宏 指 令 即 可 ,由 汇编 器 在 汇 
编 时 产生 对 应 的 代码 。 这 样 处 理 能 够 简化 源 程序 ,同时 又 不 影响 目标 程序 的 效率 。 

(2) 扩充 指令 集 。 虽 然 一 款 CPU 的 指令 集 是 确定 的 ,但 是 利用 宏 可 以 在 形式 上 扩充 指令 
集 。 扩 充 后 的 指令 集 是 机 器 指令 集 与 宏 指 令 集 的 并 集 。 在 维持 程序 的 兼容 性 方面 这 是 很 有 
用 的 。 

【 例 6-52】 声明 把 8 个 通用 寄存 器 压 入 堆栈 的 宏 指 令 PUSHALL。 

%macro PUSHAL 0 


. 
吧 名 呈 只 号 去 


加 


% endmacro 

在 最 初 的 Intel 8086/8088 处 理 器 中 ,并 没有 把 通用 寄存 器 全 压 栈 指令 。 

(3) 改变 某 指令 助 记 符 的 意义 。 宏 指令 名 可 以 与 指令 助 记 符 或 者 伪 指 令 符 相 同 , 在 这 种 
情况 下 , 宏 指 令 的 优先 级 最 高 ,而 同名 的 指令 或 伪 指 令 就 失效 了 。 利 用 宏 指 令 的 这 一 特点 ,可 
以 改变 指令 助 记 符 的 意义 。 

【 例 6-53】 在 声明 如 下 宏 指 令 后 , 助 记 符 LODSB 所 表示 指令 的 意义 就 会 发 生变 化 。 

%macro lodb 0 

mov ah [si 
Inc SI 
% endracro 


6.7.2 单行 宏 的 声明 和 使 用 


为 了 提供 更 多 的 实用 性 ,汇编 器 NASM 还 支持 单行 宏 。 类 似 地 ,必须 先 声 明 后 使 用 。 
单行 宏 的 声明 形式 如 下 : 
%define 宏 名 ( 参数 表 ) ” 宏 体 

其 中 ,汇编 指示 % define 表示 声明 宏 ; 宏 名 适用 一 般 标识 符 命名 规则 ; 参数 表 由 逗号 分 隔 的 参 
数 构成 ; 宏 体 是 包含 参数 的 表达 式 。 可 以 没有 参数 表 , 如 果 没 有 参数 表 , 那 么 也 不 需要 圆 
括号 。 

【 例 6-54】 演示 没有 参数 的 单行 宏 的 声明 和 使 用 。 

假设 先 声 明 3 个 单行 的 宏 , 如 下 所 示 : 

%define cont 人 2 





%define move MN 
% define cleax XR EAX EAX 


随后 ,就 可 以 调用 它们 。 假 设 源 程序 中 的 调用 如 下 所 示 : 
WW CX count 
me EMX EX 
cleax 
move esi, cont 
mve dx, contt 3 
在 汇编 时 ,上 述 程 序 片 段 将 被 扩展 成 如 下 的 指令 片段 : 
MV &X?2 
Ww EX EX 
XR EM EM 
MY esi,12 
WW dx 12+3 
从 上 述 扩展 所 得 可 知 , 原 样 替换 。 虽 然 这 仅仅 是 示例 ,但 说 明 宏 扩 展 的 原样 替换 确实 带 来 
很 多 方便 。 
【 例 6-55】 演示 具有 参数 的 单行 宏 的 声明 和 使 用 。 
先 声 明 如 下 的 两 个 宏 : 
%define lva m) [EBP- nl] 
%define arraMai) dword [ar 钵 站 
然后 分 别 调用 这 两 个 宏 , 如 下 所 示 : 
MW AL lvar 1) 
MY EX lvar 2) 
MY EA array EX 3) 
MY EX array ERX ESI) 
MY EAX array buff, 1) 
在 汇编 时 ,上 述 程序 片段 将 被 扩展 成 如 下 的 指令 片段 : 
MV “AL [EBP- 杀人 
MY EX [EBP- 2 
MV EM dword [ECX+ 人 r 相 
MW EX dword [ERX+ 4 ESD 
WY EM dword [buff+ 杀生 
注意 ,buff 应 该 是 在 源 程序 中 定义 的 表示 缓冲 区 的 名 称 (标号 ) ,或 者 是 定义 过 的 标识 符 ， 
否则 汇编 器 会 发 出 错误 提示 信息 。 
【 例 6-56】 演示 具有 参数 的 单行 宏 的 声明 和 使 用 ,注意 参数 的 表示 方式 。 
设 有 如 下 的 程序 片段 : 
%define fx) x*4 
%define gx) (x)*4 


mv al,f1) 
mo bl,f1+2) 
mov al,g1) 
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mo bl,g12) 
在 汇编 时 ,将 得 到 如 下 的 扩展 代码 : 
mov al, 天 位 4 


mov bl 开 什 条 4 
my al,7(1)*4 
mov bl, (12)*4 
为 了 在 调用 时 参数 可 以 采用 表达 式 ,所 以 在 声明 时 宏 体 中 的 参数 应 该 出 现在 括号 内 。 
这 种 单行 宏 与 C 语言 中 的 宏 很 相似 。 由 于 C 语言 的 语句 由 分 号 作为 结束 符 , 而 且 源 程序 
中 的 行 可 以 包含 多 条 语句 (采用 续 行 符 后 ,可 以 包含 得 更 多 ), 因 此 C 语言 中 似乎 只 需要 单 
行 宏 。 


6.7.3 宏 相 关 方 法 


为 了 更 好 地 发 挥 宏 的 作用 ,汇编 器 NASM 还 支持 一 些 相关 方法 ,下 面 进行 简要 说 明 。 

1. 宏 名 的 * 脱 敏 ” 

利用 %define 声明 的 宏 名 是 大 小 写字 母 敏 感 的。 在 通过 “%define abc 45678” 声 明 宏 
abc 之 后 , 源 程序 中 只 有 “abc” 会 被 扩展 成 “45678”, 其 他 “Abc”ABC? 或 “aBC?” 等 不 会 被 扩展 
成 “45678”。 

为 了 使 得 宏 名 对 大 小 写字 母 不 敏感 ,可 以 用 汇编 指示 %idefine 来 声明 宏 。 字 母 i 表示 
“insensitive” 。 

【 例 6-57】 演示 声明 大 小 写字 母 不 敏感 的 宏 及 其 调用 。 

% idefine abc 4568 


MY DX Ar1 
AD DL., [Ab 

在 汇编 时 ,将 被 扩展 成 如 下 的 指令 : 
MV DX 45678+1 
AD DL [4567] 


类 似 地 ,利用 %macro 声明 的 宏 指 令 名 也 是 大 小 写字 母 敏 感 的 。 为 了 使 得 宏 指 令 名 对 大 
小 写字 母 不 敏感 ,可 以 用 汇编 指示 %imacro 来 声明 宏 指 令 。 
【 例 6-58】 演示 声明 大 小 写字 母 不 敏感 的 宏 指 令 及 其 调用 。 
% imacro movei 2 
push byte %2 
pp %1 
% endmacro 
WE EX9 
在 汇编 时 ,上 面 的 宏 指 令 会 被 扩展 成 如 下 的 指令 片段 : 
push byte 9 
pop 
注意 ,虽然 压 栈 操作 和 出 栈 操 作 至 少 是 16 位 ,但 上 述 指令 中 的 byte 表示 操作 数 自身 只 有 
8 位 ,这 样机 器 指令 能 够 少 一 个 字 节 。 





宏 


3 


2. 宏 的 嵌 套 
宏 的 嵌 套 既 有 声明 时 的 嵌 套 ,又 有 使 用 时 的 嵌 套 。 声 明 时 的 嵌 套 指 在 宏 体 中 使 用 了 其 他 
使 用 时 的 嵌 套 指 在 调用 宏 时 参数 是 其 他 宏 。 下 面 先 举例 说 明 声 明 时 的 宏 嵌 套 。 
【 例 6-59】 假设 已 经 声明 了 例 6-46 所 示 的 宏 PutChar, 那 么 可 以 声明 宏 NewLine 如 下 ， 
%macro NewLine 0 
Putohar 13 
PutChar 10 
% endmacro 
使 用 声明 过 的 宏 指 令 ,就 像 使 用 普通 指令 一 样 。 
此 后 , 宏 指 令 语句 “NewLine” 会 被 扩展 成 如 下 的 指令 片段 ,为 了 示意 添加 了 注释 。 
WwW D13 ;PutChar 13 
WwW AMH2 
INT 2H 
WwW D10 ;PutChar 10 
MV M2 
INT “2IH 
【 例 6-60】 演示 单行 宏 的 嵌 套 声明 。 假 设 两 个 单行 宏 声 明 如 下 : 
% define lo x) (x) & OOf 
%define higx) (Ionx)) <<4 
其 中 , 宏 high 使 用 了 宏 low。 又 假设 宏 调 用 如 下 所 示 : 
mo al, higk 'a) 
my bl, hig 'a'+1) 
那么 汇编 时 ,可 得 到 如 下 所 示 的 扩展 结果 : 
my al(('a) &OOf) <<4 
mov bl(('a+1) &OOf) < 4 
由 此 可 见 , 在 声明 宏 时 ,括号 的 使 用 很 重要 。 
在 例 6-54 中 ,已 经 演示 了 单行 宏 的 嵌 套 调用 。 下 面 来 看 一 个 调用 宏 指令 时 ,采用 单行 宏 


作为 参数 的 示例 。 


【 例 6-61】 假设 有 如 上 声明 的 宏 指 令 PutChar 和 宏 low, 又 假设 有 如 下 宏 调 用 : 
Putchar lox 'B) + '0' 
Puthar ( lod 'B)) + "0 

那么 汇编 时 ,可 得 到 如 下 所 示 的 扩展 结果 : 


MV DL('B') & OOFt '0 MN DL OH 
MV AL2 
INT 21H 
WV  pDLC('B) &00f) + '0 MW DL 
MV AL2 
INT 2H 
由 此 可 见 , 在 宏 调用 时 ,括号 的 使 用 仍然 很 重要 。 
3. 宏 体 中 的 标号 


在 声明 宏 指令 时 ,如 果 宏 体 中 含有 普通 标号 ,那么 在 一 个 程序 中 多 次 调用 宏 ,将 导致 标号 
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重复 出 现 。 在 例 6-50 中 ,声明 宏 指 令 TOASC 时 ,为 了 避免 在 宏 体 中 出 现 标 号 ,利用 了 表示 当 
前 偏 移 的 记号 $ ,还 手工 计算 了 指令 机 器 码 的 长 度 。 

其 实 ,汇编 器 NASM 允许 在 声明 宏 指 令 时 使 用 标号 。 在 标号 前 面 加 上 “%%”, 就 表示 该 
标号 是 宏 的 局 部 标号 。 这 样 处 理 后 ,虽然 在 多 处 调用 宏 指 令 ,但 不 会 出 现 同一 个 标号 。 

【 例 6-62】 声明 宏 指 令 TOASC 如 下 ,其 中 含有 局 部 标号 。 

%macro TOASC 0 


AD A OH 
AD 人 LI'0 
OP AL' 
JE %%K 
AD AL7 
%% OK: 
% endmacro 


【 例 6-63】〗 如 下 声明 的 宏 指令 CMOVNZ 具有 “不 相等 ”时 传送 的 功能 。 
%macro VMZ 2 


业  %% SKIP 
MW %1,%2 
% % SKIP: 
% endmacro 
假设 有 如 下 使 用 宏 指 令 CMOVNZ 的 代码 片段 : 
OP QL 五 
OM 以 x 
OR Sl, Sl 
QMMZ AL3 
在 汇编 时 得 到 的 实际 指令 片段 如 下 所 示 , 为 了 方便 区 分 ,以 注释 形式 添加 了 标记 < 1 >。 
OP 0 
 ..@2KIP x1> 
WW A BX x1> 
..@2 KIP: <1> 
RR Sl,sl 
 ..@3KIP x1> 
MY AL 3 <x1> 
..@ 3 KIP: 和 1> 
由 此 可 见 , 普 通 情况 下 应 该 避免 使 用 以 *.. @ ?为 首 的 标号 。 
4. 灵活 的 宏 参 数 


为 了 充分 发 挥 宏 指 令 的 作用 ,汇编 器 NASM 允许 以 较 灵活 的 方式 使 用 参数 。 尤 其 在 使 用 
花 括号 {) 之 后 ,就 更 灵活 。 

【 例 6-64】〗 如 下 声明 宏 DBMESS., 参 数 1 作为 标号 的 一 部 分 。 

% macro 4 


NESS%1 DB %2 OH OH '$' 
% endmacro 


假设 使 用 宏 DBMESS 的 语句 如 下 : 
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1," HHLO" 
3{"Hi" ,4H 4H} 
在 汇编 时 ,可 得 到 如 下 扩展 的 结果 : 
MESSI DB "HHLO", OH OH '$' 
DB “Hr, 4H 4H OH OH 他/ 
【 例 6-65】〗 如 下 声明 宏 DWMESS, 参 数 1 作为 标号 的 一 部 分 。 
%macro DWESS 2 
MESS% {1} 1 DW%2 
% endmacro 
假设 使 用 宏 DWMESS 的 语句 如 下 : 
DWESS 5 33 
DWESS A 45 
在 汇编 时 ,可 得 到 如 下 扩展 的 结果 : 
NESS51 DW 33 
NESSAM DW 4:5 
注意 在 上 述 两 例 中 花 括号 {} 的 使 用 形式 。 
5. 条 件 码 作为 宏 参 数 
汇编 器 NASM 对 于 含有 条 件 代码 的 宏 参 数 会 做 出 特殊 处 理 。 在 宏 体 中 的 “% 十 1” 明 确 表 
示 参 数 1 应 该 是 一 个 条 件 代码 ,如 果 调 用 宏 指 令 时 ,参数 1 不 是 条 件 代 码 , 将 会 有 出 错 提 示 信 
息 。 在 宏 体 中 的 “%-2” 同 样 明 确 表示 参数 2 应 该 是 一 个 条 件 代 码 , 但 在 扩展 时 采用 与 参数 2 
相反 的 条 件 代码 。 
【 例 6-66】 如 下 声明 的 宏 指令 CMOV 有 3 个 参数 ,在 某 种 程度 上 , 它 能 代替 有 些 IA-32 
处 理 器 所 支持 的 条 件 传送 指令 。 
% macro OV 3 
-1 %% SKIP 
WY %2 %3 
% % SKIP: 
% endmacro 
假设 调用 上 述 宏 指令 如 下 : 
ON AM EX 
WV LEA, 18 
汇编 时 可 得 到 如 下 的 扩展 结果 : 


Jna ..@2SKIP 

MV XE 
..@2SKIP: 

Jnle ..@3SKIP 

MV AL18 
..@3SKIP: 


注意 上 述 条 件 转移 指令 中 条 件 码 的 变化 。 


第 6 章 汇编 语言 





习 题 


1. 简要 说 明 IA-32 系列 CPU 指令 集 的 分 组 情况 。 

2. 请 说 明 实 方式 下 存储 器 分 段 必 须 满足 的 两 个 条 件 。 最 多 可 把 1MB 地 址 空间 划分 成 几 
个 段 ? 最 少 可 把 1MB 地 址 空间 划分 成 几 个 段 ? 

3. 请 说 明 实 方式 下 二 维 逻 辑 地 址 到 一 维 物理 地 址 的 转换 过 程 。 

4. 当 段 重 释 时 ,一 个 存储 单元 的 地 址 可 表示 成 多 个 逻辑 地 址 。 那 么 物理 地 址 12345H 可 
表示 多 少 个 不 同 的 逻辑 地 址 ? 偏 移 最 大 的 逻辑 地 址 是 什么 ? 偏 移 最 小 的 逻辑 地 址 是 什么 ? 

5. 执行 中 的 程序 某 一 时 刻 最 多 可 访问 几 个 段 ? 程序 最 多 可 具有 多 少 个 段 ? 程序 最 少 有 
几 个 段 ? 

6. 为 什么 称 CS 为 代码 段 寄 存 器 ? 为 什么 称 SS 为 堆栈 段 寄 存 器 ? 

7. 什么 场合 下 默认 的 段 寄 存 器 是 SS? 为 什么 要 这 样 安排 ? 

8. 举例 说 明 使 用 段 超越 前 组 的 场合 。 

9. 简要 说 明 16 位 存储 器 寻 址 方式 与 32 位 存储 器 寻 址 方式 的 共同 点 和 不 同 点 。 

10. 请 说 明 如 下 指令 中 存储 器 寻 址 方式 错误 的 原因 。 


WV Dx [AI MY A [4 EX] 
WV DX [Cx+ SD MV AL [Drsr-3 
MV DX [Bpr BX+ MY AL [Dx+ 10] 


11. 哪些 存储 器 寻 址 方式 可 能 导致 有 效 地 址 超出 64KB 的 范围 ? 在 实 方式 下 发 生 这 种 情 
况 会 有 何 后 果 ? 

12. 什么 情况 下 由 段 值 和 偏 移 确定 的 存储 单元 地 址 会 超出 1MB 的 范围 ? 在 实 方式 下 发 
生 这 种 情况 会 有 何 后 果 ? 

13. 汇编 语言 的 语句 有 哪些 类 型 ? 它们 各 自 的 主要 作用 是 什么 ? 

14. 标号 和 名 称 有 何 异同 之 处 ? 

15. 汇编 语言 中 的 表达 式 与 高 级 语言 中 的 表达 式 , 有 何 相同 点 和 不 同 点 ? 

16. 汇编 语言 中 数值 表达 式 与 地 址 表达 式 有 何 区 别 ? 

17. 计算 如 下 各 个 数值 表达 式 的 值 ( 设 汇编 器 是 NASM)。 


(1) OWB & OF (2) 'H' | ooto000B 
(3) 2H & 4H|6H (4 (0d423<< 4 +066 
(5) ~ (55° 1234) (90 104>> 2+3 

(7D "EE" &46H (8) 124% 4 

(9) -1 /3 (10) -1/ 3 


18. 汇编 器 NASM 允许 多 种 形式 表示 整数 。 假 设 执 行 如 下 指令 片段 ,相关 通用 寄存 器 的 
内 容 是 什么 ? 
mov ax $08 
mv bx 3I0q 
mv cx 1100 1000b 
mov dx (b1100 1000 


19. 假设 如 下 片段 是 某 个 COM 类 型 程序 的 开始 部 分 。 请 写 出 执行 指令 后 有 关 通 用 寄存 





器 的 内 容 
org 10H ; 设 定 起 始 偏 移 100H 
JP BEGIN ;转移 到 BEGIN 处 
alim 16 ;16 字 节 对 齐 
VARN DW -1234567eH 
VRB DB 34 
VARD DD -12345078H 
MESS DB ~ 'Abode', OH OH 2 
BEGIN: 
WAX VARN A 
MY EX VAFB+1 ;BE 
WW CC VAD+2 :OF 
MY DX MESS De 
PUSH Cs 
pp DS 
WV AX [WRI :AE 
MY BX [VARB+]] BE 
WW CX [VARD+ 2 :CE 
MV DX [WESS] DE 
MV SI, VAR 1 :SE= 
WW EMX [SI+] ;ER 
WW EX [Si+ 习 :BE 
LEA DI, [Ess] :DI= 
WW EX [D0 ;ED 
WW EX [DI+ 习 :DE 


20. 假设 如 下 片段 是 某 个 COM 类 型 程序 的 一 部 分 。 请 写 出 执行 指令 后 有 关 通 用 寄存 器 
的 内 容 。 


org 10H ; 设 定 起 始 偏 移 10H 
MY MG 

WwW DA 

MW BX Buffer 

WY DWFD [eX], 0 

WW [B+4, RD 0 

DEC WORD [BX+ 3] 

AD BYE [BX+2],2 

MW EAX [EX] ;EAE 

WW EX [Bt 习 :DE 

RSH WRD1 

PUSH BNE2 ; 压 栈 操作 数 是 00H 
PUSH ”DRD 3 

PP 以 ;ERE 

PP DX :办 

POP EX :EE 

Jp $ :无限 循环 





Buffer 中 ”HahHaHehe” 


21. 假设 如 下 片段 是 某 个 COM 类 型 程序 的 开始 部 分 。 请 写 出 执行 指令 后 有 关 通 用 寄存 
器 的 内 容 。 


og 10H ; 设 定 起 始 偏 移 10H 
JP Start ; 跳 过 数据 区 域 
tims 16- ($-$$)d0 
Hello db "Helloworld" ,0 
tims 10H- ($-$$) 0 
Start: MNV Sis$ 
Cs 
Ds 
从 [Hello] 


& 
员 
稚 异 办 四 千 


22. 假设 如 下 片段 是 某 个 COM 类 型 程序 的 开始 部 分 。 请 写 出 执行 指令 后 有 关 通 用 寄存 
器 的 内 容 。 

Length eq 322B 
100H 
以 Length 
BX Length /4 
CS 
Ds 
EAX, [Buff3] :EA 
MX [Buff2+ Length / 2] ENE 
AL [Bufft+ Length] ‘EAE 
$ 
Length 
Length 
Length /4 
Length /4 
Buff2- Buff1 


23. 段 间 转移 和 段 内 转移 的 本 质 区 别 是 什么 ? 

24. IA-32 系列 CPU 中 哪些 指令 可 实现 段 间 转 移 ? 

25. 请 说 明 利用 无 条 件 转 移 指令 JMP 调用 子 程序 的 方法 。 

26. 请 说 明 利 用 过 程 返回 指令 RET 实现 转移 或 者 调用 子 程序 的 方法 。 
27. 简要 说 明 汇 编 器 NASM 提供 起 始 偏 移 设 定语 句 ORG 的 作用 。 

28. 为 什么 目标 文件 会 有 多 种 不 同 的 格式 ? 

29. 为 了 直接 生成 纯 二 进 制 目标 文件 ,对 汇编 源 程序 文件 有 何 要 求 ? 
30. 什么 是 重 定位 ? 如 何 实现 重 定位 ? 

31. 对 于 非 纯 二 进 制 目标 文件 ,为 什么 需要 通过 链接 器 生成 可 执行 程序 ? 
32. 请 说 明 汇编 器 NASM 提供 段 模式 声明 语句 BITS 的 作用 。 


e383 
容 茶 
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33. 指令 机 器 码 可 能 含有 操作 数 尺寸 前 级 和 存储 器 地 址 尺寸 前 级 ,请 说 明 它们 的 作用 。 
34. 比较 宏 与 子 程序 ,它们 有 何 异 同 ? 它们 的 本 质 区 别 是 什么 ? 

35. 简 述 宏 指 令 的 用 途 ? 并 根据 每 种 用 途 分 别 举例 说 明 。 

36. 宏 指 令 中 的 参数 有 何 用 途 ? 宏 调 用 如 何 传递 参数 ? 

37. 汇编 器 NASM 支持 单行 宏和 多 行 宏 ,它们 各 有 何 特点 ? 

38. 如 何在 宏 体 中 安排 局 部 标号 ? 

39. 假设 在 源 程序 中 经 常 要 用 到 如 下 一 组 变量 的 定义 ,请 设计 一 个 宏 , 以 方便 编写 源 


Signature 中 "YANG" ;不 变 
Versim dy 1 ;不 变 
Length dn 0 可 变 
Start od 0 河 变 
Zoneseg dy 0 河 变 
Reserved dd 0 ;保留 (不 变 ) 


40. 请 声明 一 个 与 无 条 件 段 间 直接 转移 指令 等 价 的 宏 指 令 , 它 含有 两 个 分 别 指定 段 值 和 
偏 移 的 操作 数 。 

41. 程序 是 否 一 定 从 代码 段 的 偏 移 0 开始 执行 ? 如 果 不 是 ,那么 如 何 指定 ? 

42. 请 编写 一 个 程序 ,显示 输出 26 个 英文 字母 ,重复 9 行 。 分 别 采 用 COM 类 型 和 EXE 
类 型 。 

43. 请 编写 一 个 程序 ,以 十 进 制 数 的 形式 显示 所 按键 的 ASCII 码 。 分 别 采用 COM 类 型 
和 EXE 类 型 。 

44. 请 编写 一 个 程序 ,把 位 于 OFFFFH 段 开 始 处 的 16 个 字 节 的 数据 复制 到 开始 地 址 为 
0B800:0000H 的 区 域 。 

45. 请 编写 一 个 程序 ,以 十 六 进 制 数 的 形式 ,显示 输出 内 存 地 址 OFFFFoH 开始 的 8 个 字 
节 的 值 。 

46. 将 地 址 F000:0000H 开始 的 内 存 区 域 视 为 数据 区 ,并 假设 安排 了 100 个 字 节 的 无 符 
号 8 位 二 进 制 数 。 请 编写 一 个 程序 求 它们 的 和 ,并 以 十 进 制 数 的 形式 显示 上 述 累加 和 。 

47. 将 地 址 F000;0000H 开始 的 内 存 区 域 视 为 数据 区 ,并 假设 安排 了 16 个 32 位 二 进 制 
数 。 请 编写 一 个 程序 求 它们 的 和 ,并 以 十 六 进 制 数 的 形式 显示 上 述 累 加 和 。 

48. 将 地 址 F000:0000H 开始 的 内 存 区 域 视 为 数据 区 ,并 假设 安排 了 128 个 16 位 二 进 制 
数 。 请 编写 一 个 程序 统计 其 中 的 正 数 负数 和 零 的 个 数 . 并 以 十 进 制 数 的 形式 分 别 显示 统计 
结果 。 

49. 请 编写 一 个 程序 ,首先 接收 用 户 从 键盘 输入 两 个 十 进 制 整数 ,然后 计算 这 两 个 数 的 和 
与 差 ,最 后 分 别 输出 上 述 的 和 与 差 。 假 设 用 户 输入 的 十 进 制 数 不 超 过 65535 。 

50. 请 编写 一 个 程序 ,首先 接收 用 户 从 键盘 输入 两 个 自然 数 ,然后 计算 这 两 个 数 的 最 小 公 
倍数 ,最 后 输出 上 述 公 倍数 。 假 设 用 户 输入 的 自然 数 不 超过 65535 。 

51. 请 编写 一 个 程序 ,以 十 六 进 制 数 的 形式 显示 输出 如 下 指令 的 机 器 码 。 分 析 这 些 指令 
的 机 器 码 。 
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A [ECG 僻 
AMX [ECX+ 僻 
EAX [ECX+ 馈 


编写 一 个 程序 ,以 十 六 进 制 数 的 形式 显示 输出 如 下 指令 的 机 器 码 。 分 析 这 些 指令 


各 得 豆 豆 豆 豆 
县 
黑 


a 
ka 
起 


的 机 器 码 。 
SHORT$+2 


另 与 和 RS 与 
吴 


ES 
a 
a 





BIOS 和 虚拟 机 


BIOS 为 用 户 使 用 PC 提供 了 最 基本 的 手段 ,市场 上 销售 的 PC 可 以 不 带 操作 系统 ,但 总 会 
带 BIOS。 虚 拟 机 也 会 提供 同样 的 BIOS。 本 章 以 键盘 输入 .显示 输出 和 磁盘 读 写 为 重点 ,说 明 
BIOS 及 其 调用 方法 ,同时 介绍 虚拟 机 及 其 使 用 ,最 后 还 提供 了 一 个 用 于 运行 演示 程序 的 简易 
加 载 器 。 

本 章 的 示例 ,请 不 要 在 VC 环境 中 采用 嵌入 汇编 的 方式 验证 。 


7.1 BIOS 及 其 调用 


在 一 台 普 通 PC 上 ,可 以 安装 Windows 或 者 Linux 等 不 同 的 操作 系统 ,在 操作 系统 自 举 
之 前 ,由 BIOS 提供 基本 的 输入 输出 服务 。 本 节 简 要 介绍 BIOS, 举 例 说 明 调用 BIOS 的 基本 方 
法 。 


7.1.1 BIOS 简介 


BIOS(Basic Input/Output System) 就 是 基本 输入 输出 系统 , 它 被 固化 在 ROM 中 。BIOS 
包含 了 主要 1/O 设备 的 处 理 程序 和 许多 常用 例 行 程序 ,它们 一 般 以 中 断 处 理 程序 的 形式 存 
在 。BIOS 是 覆盖 在 硬件 系统 上 的 第 一 层 软 件 , 它 直接 操纵 1/O 设备 或 者 硬件 设备 ,实现 计算 
机 系统 的 基本 输入 或 输出 。 

BIOS 支持 基本 的 键盘 输入 ,能够 根据 用 户 的 按键 操作 ,得 到 对 应 键 符 的 ASCII 码 等 。 它 
支持 基本 的 显示 输出 ,能够 根据 字符 的 ASCII 码 和 显示 属性 (颜色 ) ,在 屏幕 上 的 指定 位 置 显 
示 对 应 的 字符 。 它 还 支持 基本 的 鼠标 操作 和 打印 操作 等 。 

在 没有 安装 操作 系统 的 计算 机 上 ,可 以 通过 BIOS 使 用 计算 机 。 通 过 BIOS, 可 以 读 取 外 
部 存储 设备 (如 磁盘 ) 上 的 特定 程序 。 利 用 BIOS, 这 样 的 程序 可 以 进行 基本 的 键盘 输入 和 显示 
输出 等 ,也 可 以 直接 读 写 存 储 设 备 上 指定 位 置 处 的 数据 。BIOS 为 用 户 使 用 * 裸 机 ”提供 了 简 
单 的 基本 的 途径 。 当 然 , 这 样 做 很 不 方便 ,所 以 才 需 要 操作 系统 。 

在 操作 系统 启动 自 举 的 过 程 中 ,BIOS 发 挥 重要 作用 。 利 用 BIOS ,操作 系统 引导 程序 , 获 
取 机 器 的 基本 硬件 属性 ,加 载 操 作 系统 自身 代码 ,开展 与 用 户 的 简单 交互 。 依 靠 BIOS ,操作 系 
统 完成 启动 自 举 。 

简易 的 操作 系统 可 以 直接 建立 在 BIOS 的 基础 之 上 。 曾 经 十 分 流行 的 磁盘 操作 系统 
(Disk Operating System,DOS) 就 是 这 样 ,通过 BIOS 操纵 控制 硬件 。 虽然 DOS 提供 一 系列 输 
入 和 输出 功能 ,但 这 些 功 能 的 实现 却 以 BIOS 为 依托 。 在 这 样 的 环境 中 ,应 用 程序 往往 可 以 绕 
过 操作 系统 ,直接 通过 BIOS 进行 输入 或 输出 。 在 某 些 情形 下 .应 用 程序 这 样 做 可 以 免 受 操作 
系统 的 制约 。 
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Windows 和 Linux 等 操作 系统 在 启动 成 功 后 ,自己 会 直接 控制 操纵 硬件 。 这 样 的 操作 系 
统 完全 掌控 硬件 ,实现 完备 的 输入 和 输出 功能 。 为 了 更 好 地 支持 多 任务 ,它们 把 应 用 程序 与 
BIOS 完全 隔离 ,甚至 废弃 固有 的 BIOS。 在 这 样 的 环境 中 ,应 用 程序 无 法 直接 使 用 BIOS。 


7.1.2 键盘 输入 和 显示 输出 


键盘 输入 和 显示 输出 属于 最 基本 和 必要 的 功能 ,下 面 简要 介绍 BIOS 提供 的 键盘 输入 和 
显示 输出 的 部 分 功能 及 其 调用 方法 。 

1. BIOS 的 键盘 输入 

简单 地 可 以 把 键盘 上 的 键 分 为 五 类 : 字符 键 ( 如 字母 .数字 和 符号 等 ) .功能 键 (如 Fl 和 
PgUp 等 ) ,控制 键 ( 如 Ctrl、Alt 和 左右 Shift)、 双 态 键 (如 Num Lock 和 Caps Lock 等 ) .特殊 请 
求 键 (如 Print Screen 等 ) 。 字 符 键 有 对 应 的 ASCII 码 ,其 他 的 键 并 没有 ASCII 码 。 

键盘 上 的 每 个 键 有 一 个 代表 键 位 置 的 扫描 码 。 在 用 户 实施 按键 动作 后 ,键盘 作为 外 部 设 
备 会 发 送 扫 描 码 到 主机 。 

在 用 户 按键 后 ,键盘 中 断 处 理 程序 根据 所 按键 的 扫描 码 进 行 处 理 。 它 把 字符 键 的 扫描 码 
和 对 应 的 ASCII 码 存 到 键盘 缓冲 区 ( 某 个 特定 的 内 存 区 域 ) ,并 记录 控制 键 和 双 态 键 的 状态 。 
在 8.3 节 和 8.4 节 有 进一步 介绍 。 

BIOS 中 提供 键盘 输入 功能 的 程序 被 称 为 键盘 I/O 程序 。 它 提供 的 部 分 功能 列 于 表 7. 1， 
每 一 个 功能 有 一 个 编号 。 在 调用 键盘 1/O 程序 时 ,把 功能 编号 置 入 AH 寄存 器 ,然后 发 出 特 
定 的 调用 指令 “INT 16H”。 调 用 返回 后 ,从 有 关 寄 存 器 中 取得 出 口 参数 。 期 间 , 除 含有 出 口 
参数 的 寄存 器 外 ,其 他 寄存 器 内 容 保持 不 变 。 在 调用 表 7. 1 所 列 功 能 时 ,无须 人 口 参数 。 


表 7.1 键盘 I/O 程序 的 基本 功能 











功 能 出 口 参数 说 明 
AH=0 AL= 字 符 的 ASCI[ 码 | 如 果 无 字符 可 读 ( 键 盘 缓冲 区 空 ), 则 等 待 ; 字符 也 包括 
从 键盘 读 一 个 字符 “| AH= 字 符 的 扫描 码 | 功能 键 ,对 应 ASCII 码 为 0 
AH=1 ZF==1 表示 无 键 可 读 ee 
判 键盘 是 否 有 键 可 读 | ZF 一 0 表示 有 键 可 读 。 | AH 一 字符 的 扫描 码 
的 AL 一 变换 键 状 态 字 节 
获取 变换 键 当 前 状态 加 








把 控制 键 和 双 态 键 统称 为 变换 键 ,调用 键盘 I/O 程序 的 2 号 功能 可 获得 各 变换 键 的 状态 。 
变换 键 状 态 字 节 各 位 的 定义 如 图 7. 1 所 示 , 其 中 高 4 位 记录 双 态 键 的 变换 情况 ,每 按 一 下 双 态 
键 , 则 对 应 的 位 值 取 反 ; 低 4 位 反映 控制 键 是 否 正 被 按 下 , 按 着 某 个 控制 键 时 ,对 应 的 位 为 1。 









































76543210 
1-Insert 状 态 已 变换 | [= 1= 按 下 右 Shift 键 
1=Caps Lock 状 态 已 变换 1= 按 下 左 Shif 键 
1=Num Lock 状 态 已 变换 一 1= 按 下 控制 键 Ctrl 
1=Scroll Lock 状 态 已 变换 一 ~ 1= 按 下 替换 键 Alt 














图 7.1 变换 键 状态 字 节 各 位 的 定义 
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【 例 7-1】 如 下 程序 片段 利用 BIOS 从 键盘 读 一 个 字符 。 
MV Ah0 
INT 19H 
如 果 有 键 可 读 (键盘 缓冲 区 中 有 字符 ) ,那么 立即 返回 , 读 到 的 字符 是 调用 发 出 之 前 用 户 按 
下 的 字符 。 如 果 无 键 可 读 ( 键 盘 缓冲 区 空 ) ,那么 等 待 用 户 按键 后 才 返回 , 读 到 的 字符 是 调用 发 
出 之 后 用 户 按 下 的 字符 。 
【 例 7-2】 从 键盘 获得 在 调用 发 出 之 后 用 户 按 下 的 字符 。 在 接收 用 户 输入 重要 信息 时 ， 
往往 会 有 这 样 的 需求 。 下 面 的 程序 片段 先 清除 键盘 缓冲 区 ,然后 再 从 键盘 读 一 个 字符 。 


QLEAR: 
WwW M1 
INT 1 键盘 缓冲 区 空 吗 ? 
沁 清 空 , 跳 转 
MV Mo 
INT 16H ;从 键盘 缓冲 区 取 走 一 个 字符 
JP ”SHORT QEMR ;直到 键盘 缓存 区 空 为 止 
kK: 
MV Mo 
IN 1 ;等待 键盘 输入 


由 此 可 见 , 利 用 BIOS 的 键盘 输入 功能 ,可 以 更 灵活 地 控制 键盘 输入 。 

2. BIOS 的 显示 输出 

显示 控制 器 支持 两 类 显示 方式 : 图 形 显示 方式 和 文本 显示 方式 。 每 一 类 显示 方式 还 含有 
多 种 显示 模式 。 

文本 显示 方式 是 指 以 字符 为 单位 显示 的 方式 。 字 符 通常 指 字母 .数字 .普通 符号 (如 运算 
符号 ) 和 一 些 特殊 符号 (如 萎 形 块 和 和 矩形 块 )。 虽然 现在 几乎 不 采用 文本 显示 方式 ,但 它 却 是 最 
基本 的 显示 方式 。 可 以 认为 ,Windows 的 控制 台 窗 口 采用 文本 显示 方式 ,当然 它 是 模拟 形 
成 的 。 

最 经 典 的 文本 显示 模式 是 25 行 80 列 。 早 先 的 PC 主要 采用 这 种 显示 模式 。 在 该 文本 显 
示 模 式 下 ,显示 器 的 屏幕 被 划分 成 80 列 25 行 ,所 以 每 一 屏 可 显示 2000(80X25) 个 字符 。 用 
行 号 和 列 号 组 成 的 坐标 来 定位 屏幕 上 的 每 个 可 显示 位 置 。 左 上 角 的 坐标 规定 为 (0,0) ,向 右 增 
加 列 号 ,向 下 增加 行 号 ,于 是 右 下 角 的 坐标 便 是 (79 ,24)。 

屏幕 上 显示 的 字符 取决 于 字符 代码 及 字符 属性 。 这 里 的 字符 代码 指 ASCII 码 , 它 代表 显 
示 的 字符 。 这 里 的 字符 属性 指 显示 属性 , 它 规定 字符 显示 时 的 特性 ,可 以 简单 地 认为 是 显示 颜 
色 , 包 括 了 采用 RGB 表示 的 前 景 和 背景 。 前 景 颜 色 和 背景 颜色 一 起 确定 字符 的 显示 效果 ， 
表 7.2 列 出 了 几 种 典型 的 显示 属性 值 。 当 前 景 和 背景 相同 时 ,字符 就 看 不 出 了 。 

表 7.2 几 种 典型 属性 值 的 效果 
效 果 BL 十 六 进 制 值 


黑 底 蓝 字 01 


G B 
1 
黑 底 红字 0 04 
和 
0 
1 





黑 底 白字 07 
黑 底 黄 字 0E 


黑 底 亮 白字 OF 


-人 
eeoeeee| 只 
全 

全 已: 所 多 二 | 切 
~ oool- 
ol 
~~ oolNn 
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续 表 
效 果 BL 下 G B I R G B 十 六 进 制 值 
白 底 黑 字 0 了 1 1 0 0 0 0 70 
白 底 红 字 0 1 1 1 0 1 0 0 74 
黑 底 灰白 闪烁 字 1 0 0 0 0 1 1 1 87 
白 底 红 闪 烁 字 1 1 1 于 0 E 0 0 F4 


BIOS 中 提供 显示 输出 功能 的 程序 被 称 为 显示 1/O 程序 。 它 提供 的 部 分 功能 列 于 表 7. 3， 
每 一 个 功能 有 一 个 编号 。 在 调用 显示 1/O 程序 的 某 个 功能 时 ,应 根据 要 求 设置 好 入 口 参 数 ， 
把 功能 编号 置 人 AH 寄存 器 ,然后 发 出 特定 的 调用 指令 INT 10H”。 调 用 返回 后 ,从 有 关 寄 
存 器 中 取得 出 口 参数 。 除 含有 出 口 参数 的 寄存 器 外 ,其 他 寄存 器 内 容 保持 不 变 。 


表 7.3 显示 IO 程序 的 部 分 基本 功能 























功 能 入 口 参数 出 口 参数 说 明 
0 a 左上 角 坐 标 是 (0,0) 
置 光标 位 置 站 

CH= 光 标 开始 行 
AH=3 CL= 光 标 结束 行 CH 和 CL 含 光 标 类 型 
读 光标 位 轩 Pn DH= 行 号 左上 角 坐 标 是 (0,0) 
DL 一 列 号 
AH=5 
选择 当前 显示 页 人 
AH=8 
i AH 一 属性 
读 取 光 标 位 置 处 的 字符 和 | BH 一 显示 页 号 ee 
属性 
BH 二 显示 页 号 
AH=9 
将 字符 和 属性 写 到 光标 位 人 光标 不 移动 
到 CX 一 字符 重复 次 数 
Te eed 光标 不 移动 不 带 属性 
将 字符 写 到 光标 位 置 处 。 | 人 一 字 答 重 全 人 
RE i 在 当前 光标 处 最 示 字 符 , 开 
2 A 后 移 光标 ; 解释 回 车 .换行 、 
退 格 和 响 铃 等 控制 符 











在 屏幕 上 显示 的 字符 代码 及 其 属性 被 依次 保存 在 显示 缓冲 区 ( 某 个 确定 的 内 存 区 域 ) 中 。 
可 以 简单 地 认为 显示 页 号 是 显示 缓冲 区 的 编号 。 调 用 显示 1/O 程序 的 5 号 功能 ,可 选择 当前 
显示 页 。 一 般 总 是 使 用 第 0 页 作为 显示 页 。 
【 例 7-3】 如 下 程序 片段 利用 BIOS 在 当前 光标 位 置 处 显示 字母 ,然后 光标 移动 到 下 一 
个 显示 位 置 处 。 
MV Bo0 ;第 0 显示 页 
W A'E' 学 符 为 字母 E 





MW 用 14 ;4 号 功能 
IN 10H ;TY 方式 显示 ( 在 光标 位 置 显示 ,并 后 移 光 杨 
【 例 7-4】 如 下 程序 片段 利用 BIOS 在 当前 光标 位 置 处 显示 指定 字符 3 个 ,但 光标 并 不 
移动 。 
WwW Bo 第 0 页 
MW C3 3 个 
WW AL INA' 学 符 为 字母 A 
MW AM10 ;10 号 功能 
INT 10H ;当前 光标 处 显示 字符 多 个 


7.1.3 应 用 举例 


下 面 举例 说 明 利 用 BIOS 实现 输入 和 输出 。 当 然 , 如果 操作 系统 不 允许 应 用 程序 调用 
BIOS 提供 的 功能 ,那么 就 不 能 这 样 做 了 。 

本 小 节 介 绍 的 示例 程序 都 只 有 一 个 段 ,而 且 起 始 偏 移 都 从 100H 开始 。 利 用 汇编 器 
NASM ,能 够 方便 地 把 它们 汇编 生成 COM 型 的 可 执行 程序 。 由 于 准备 在 控制 台 窗口 中 运行 
它们 ,因此 它们 都 调用 DOS 功能 来 结束 运行 。 

【 例 7-5】〗 编写 一 个 程序 实现 以 下 功能 : 获得 用 户 按键 ; 显示 所 按键 对 应 的 字符 ; 重复 这 
一 过 程 直到 用 户 按 下 Shift 键 后 结束 程序 运行 。 

调用 键盘 1/O 程序 的 2 号 功能 取得 变换 键 状态 字 节 ,进而 判断 是 否 按 下 了 Shift 键 。 因 
为 在 调用 0 号 功能 读 键盘 时 ,如 果 读 不 到 键 (字符 键 或 功能 键 ) , 它 不 会 返回 ,所 以 在 调用 0 号 
功能 读 键盘 之 前 ,必须 先 调用 1 号 功能 判断 键盘 是 否 有 键 可 读 ,否则 可 能 会 导致 不 能 及 时 检测 
到 用 户 按 下 的 Shift 键 。 源 程序 dp71. asm 如 下 : 


%define L SHIFT O00000IB 
%define R SHIFT 00000001B 


SETIN TET 

BITS 16 ;16 位 代码 模式 

ORG 10H ;0M 类 型 可 执行 程序 
START: 

W Ah2 ; 取 变 换 键 状态 字 节 

INT 1 

TEST AL L SHIFT+ RSHIFT 浏 是 否 按 下 Shi 代 键 

JZ 0 沁 经 按 下 Shi 代 键 , 则 转 结束 

MW Ah1 ;判断 是 否 有 按键 

INT 16 

由 STRT :无 ,继续 检查 

MV Mo ;取得 所 按键 

INT 16 

MV Bo 

MY 用 14 :TY 方式 显示 所 按键 


INT 10 
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JP SIART 
OFR: 

MW AH 40H 

INT 2H 


;继续 


;调用 08 功能 ,结束 程序 


上 面 的 程序 较 好 地 说 明了 键盘 1/O 程序 主要 基本 功能 的 作用 。 
【 例 7-6】 编写 一 个 程序 在 屏幕 指定 位 置 处 显示 彩色 字符 串 。 
调用 显示 1/O 程序 的 2 号 功能 ,设置 光标 的 位 置 ; 调用 9 号 功能 , 按 指定 的 属性 显示 指定 


的 字符 。 为 了 更 好 地 演示 , 安 


排 二 重 循环 ,实施 多 列 多 行 显示 。 外 循环 控制 列 , 内 循环 控制 行 。 


同一 列 的 显示 字符 相同 ,但 显示 属性 不 同 。 同 一 行 的 显示 字符 不 同 , 但 显示 属性 相同 。 


源 程序 dp72. asm 如 下 : 


SECTIN TEXT 
BITS 16 
ORG 100 
Begin: 
CS 
DS 
Sl, Hello 
DL_ [QurCol] 
AL [SO 


DI, [Cont] 
DH [QurLin] 
BL, [Color] 


BH0 
1 


M2 
10H 


寺 豆 豆 豆 ” 豆 豆 瑟瑟 豆 豆 性 


M9 
10 


“5 


各 


DH 
EL 


“名 


豆 豆 ” 铝 豆 BB 
产 
PF 


:16 位 代码 模式 
;0M 类 型 可 执行 程序 


;DS= CS 

;SE 字 符 串 首 地 址 
;DL= 光标 列 号 
;取得 待 显 示 字 符 


币 数 ( 内 循环 的 计数 ) 
;光标 行 号 
;= 显示 属性 初 什 


:在 第 0 页 显示 
;显示 1 个 字符 


;设置 光标 位 置 


;显示 字符 (全 ) 


;调整 光标 的 行 
;调整 显示 属性 

向 数 减 1 

;不 为 0 继续 下 一 行 


;调整 光标 的 列 

沸 向 下 一 个 待 显示 字符 
;取得 待 显示 字符 

学 符 串 结 束 标志 ? 

; 否 , 继 续 显 示 
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MV M2 
INT 10H 重新 设置 光标 的 位 置 ( 19,0) 
WW A 40H ;调用 DS 功能 ,结束 程序 
INT 2H 

Hello 中 "Helloworld" ,0 ;显示 信息 

OurLin 中 5 :起 始 光标 行 号 

QurCol gb 8 起 始 光 标 列 号 

Color gb O07 ;每 行 起 始 显示 属性 

Count dy 6 币 数 


显然 ,调整 上 述 变量 的 值 ,就 可 以 改变 显示 输出 的 效果 。 

【 例 7-7〗 利用 BIOS 提供 的 键盘 输入 和 显示 输出 基本 功能 ,编写 程序 实现 以 下 应 用 : 接 
收 用 户 从 键盘 输入 一 个 由 十 进 制 数 字符 组 成 的 字符 串 , 然 后 回 显 该 字符 串 。 当 用 户 按 回 车 键 
表示 输入 结束 ,人 允许 用 户 利 用 退 格 键 修正 输入 。 

实现 思路 : OO 安排 一 个 缓冲 区 ,存放 由 用 户 从 键盘 输入 的 字符 串 。 为 了 更 灵活 ,该 缓冲 区 
的 第 一 个 字 节 给 出 字符 串 的 容量 ,也 即 最 大 长 度 , 从 缓冲 区 的 第 二 个 字 节 开始 存放 字符 串 。 字 
符 串 以 回 车 符 作为 结束 标记 。@ 安 排 一 个 子 程序 GetDStr ,接收 用 户 从 键盘 输入 数字 字符 串 。 
@ 安 排 一 个 子 程序 PutDStr, 显 示 输 出 字符 串 。@ 安 排 子 程序 GetChar 接收 键盘 输入 一 个 字 
符 , 它 调用 键盘 1/O 程序 的 0 号 功能 。 还 安排 子 程序 PutChar 显示 一 个 字符 , 它 调用 显示 1/O 
程序 的 14 号 功能 。 

对 应 的 源 程序 dp73. asm 如 下 : 


% define Space 2H ;空格 符 
% define ”Erter OH :; 回 车 符 
% define Newline On 闹 行 符 
% define Backspace (EH ; 退 格 
% define Bell OH : 响 铃 
Wdefine Lenofbuf 16 ;缓冲 区 长 度 
SECTIN TET 
BITS 16 
ORG 10H ;OOM 型 程序 10H 开 始 
Begin: 起 点 
PUSH CS 
POP DS ;DS= CS 
MO DX buffer ;D 缓冲 区 首 地 址 
CAL GetDStr ;获取 一 个 数字 串 
MX A Enter :形成 回 车 换行 效果 
CALL Putohar 
MX AL Newline 
CAL Putohar 
MN DX buffer+ 1 :DE 字符 串 首 地 址 


CAL PutDStr ;显示 一 个 字符 串 
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mov_ ah 4h 
int 2Ih ;结束 程序 
buffer: ;缓冲 区 
中 Lenofbuf ;缓冲 区 的 字符 串 容量 
resb Lenofbuf 存放 字符 串 
:于 程序 名 : Getlstr 


: 功 能 : 接收 一 个 由 十 进 制 数字 符 组 成 的 字符 串 

;人 口 参 数 : D5: 只 缓冲 区 首 地 址 

说 明 :(1 缓冲 区 第 一 个 字 节 是 其 字符 串 容量 
(2) 返回 的 字符 串 以 回 车 符 ( CH) 结尾 


GetDStr: 
PUSH SI 
WY Sl, 以 
My COL [SD ;取得 缓冲 区 的 字符 串 容量 
QP cl 1 ;如 果 小 于 1, 直接 返回 
B .lab 
INC SI 沸 向 字符 串 的 首 地 址 
XR OH OH :QH 作为 字符 串 中 的 字符 计数 器 , 清 零 
.Lab1: 
CALL GetChar 读 取 一 个 字符 
oOR 人 L 全 ;如 果 为 功能 键 , 直接 丢弃 //@ 1 
凤 SHRT .Labl 
OP AL, Enter ;如 果 为 回 车 键 ,表示 输入 字符 串 结 束 
凤 SHRT .Lab5 转 输 入 结束 
OP AL Backspace ;如 果 为 退 格 键 
凤 SHORT .Lab4 ; 转 退 格 处 理 
OP AL Space ;如 果 为 其 他 不 可 显示 字符 ,丢弃 Ma2 
B SHORT .Labl 
ap al，'0' 
jb short .Labl ;小 于 数字 符 , 丢弃 
a 
ja short .Labl ;大 于 数字 符 , 丢弃 
QP cl 1 学 符 串 中 的 空间 是 否 有 余 ? 
A SHRT .Lab3 混 , 转 存 人 字符 串 处 理 
.Lab2: 
MX AL, Bell 
CALL PutChar : 响 铃 提醒 
JP SHORT .Labl ;继续 接收 字符 
.Lab3: 
CAL PutChar ;显示 字符 


WV [SU,A ;保存 到 字符 串 





池 程 序 名 : RatDetr 


;调整 字符 串 中 的 存放 位 置 
;调整 字符 串 中 的 字符 计数 
;调整 字符 串 中 的 空间 计数 
;继续 接收 字符 


; 退 格 处 理 

闻 符 串 中 是 否 有 字符 ? 
;没有 , 响 铃 提醒 
;光标 回 退 

:用 空格 擦 除 字符 
;再 次 光标 回 退 

;调整 字符 串 中 的 存放 位 置 
;调整 字符 串 中 的 字符 计数 
;调整 字符 串 中 的 空间 计数 
;继续 接收 字符 


;保存 最 后 的 回 车 符 


涟 能 : 显示 一 个 以 回 车 符 ( COH) 结尾 的 字符 串 


;人 口 参数 : 5: 吃 字符 串 首 地 址 


PutDStr: 
PUSH SI 
MY Sl, DX 
.Lab1: 


:由 键盘 输入 一 个 字符 
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INT 16H 
FET 
下 面 对 其 中 的 子 程序 GetDStr 再 作 些 说 明 。 它 调用 分 别 代表 BIOS 键盘 输入 的 GetChar 
和 BIOS 显示 输出 的 PutChar 来 实现 其 功能 。 它 的 实现 流程 如 图 7.2 所 示 , 貌 似 有 点 复杂 ,但 
由 此 可 见 直 接 基于 BIOS 的 输入 和 输出 比较 繁杂 。 


准备 两 计数 器 和 
指向 字符 串 指针 


























获取 一 个 字符 



























把 回 车 符 存 入 字符 申 




















回 退 一 个 字符 


调整 指针 和 计数 器 
































显示 当前 字符 
1 
把 字符 存 入 字符 串 
1 
调整 指针 和 计数 器 


L 1 
图 7.2 接收 数字 串 子 程序 GetDStr 的 流程 






































从 图 7.2 可 知 ,对 由 用 户 从 键盘 输入 按键 的 识别 处 理 比较 繁杂 。 直 接 丢 弃 用 户 可 能 输入 
的 Fl 等 功能 键 ,这 些 功 能 键 并 没有 对 应 的 字符 ,其 ASCII 码 值 为 0。 除 了 识别 回 车 键 和 退 格 
键 外 ,丢弃 其 他 控制 符 (ASCII 码 值 小 于 20H)。 由 于 只 需要 十 进 制 数 字符 ,因此 还 直接 丢弃 其 
他 字符 。 

从 图 7.2 还 可 知 ,如 果 用 于 存放 数字 符 的 字符 串 空间 不 足 , 则 响 铃 提 醒 。 在 处 理 退 格 键 
时 ,只 有 当 字符 串 含 有 数字 符 时 , 退 格 键 才 起 作用 ,否则 响 铃 提醒 。 

从 源 程序 可 知 , 退 格 处 理 比较 麻烦 ,不 仅 调整 字符 串 指针 和 计数 器 ,而 且 需 要 调用 
PutChar(TTY 方式 显示 字符 )3 次 ,进行 回 退 、 擦 除 和 回 退 的 操作 ,最 终 实 现 退 格 的 效果 。 另 
外 , 响 铃 的 效果 也 是 通过 调用 TTY 方式 显示 来 实现 。 

在 上 述 程序 中 ,还 采用 了 以 符号 .引导 的 标号 ,这 些 标号 是 局 部 标号 。 这 是 汇编 器 
NASM 所 支持 的 。 





7.2 磁盘 及 其 读 写 


磁盘 是 计算 机 系统 的 外 部 存储 器 ,运行 的 程序 和 处 理 的 数据 一 般 都 会 先 存 储 在 磁盘 上 。 
本 节 简 要 介绍 磁盘 相关 基本 概念 ,说 明 调用 BIOS 进行 磁盘 读 写 的 基本 方法 ,最 后 还 分 析 主 引 
导 记 录 MBR。 


7.2.1 磁盘 简介 


覆盖 有 磁性 材料 的 碟 片 称 为 磁 碟 , 它 是 存储 介质 。 用 于 读 写 磁 碟 的 驱动 装置 称 为 磁盘 驱 
动 器 , 它 是 组 成 计算 机 系统 的 设备 之 一 。 硬 磁盘 由 一 组 磁 碟 及 其 驱动 器 构成 , 磁 碟 和 驱动 器 被 
永久 性 地 固定 封装 在 一 起 。 硬 磁盘 简称 硬盘 。 现 在 几乎 没有 软磁盘 了 ,所 以 也 常 被 称 为 磁盘 。 
在 有 些 时 候 , 也 将 其 称 为 硬盘 驱动 器 或 者 驱动 器 。 

为 了 读 写 磁盘 ,针对 磁 碟 的 每 个 面 ,都 有 一 个 磁头 (Head) ,由 磁头 实施 物理 磁性 的 读 写 。 
一 个 磁 碟 上 分 布 若干 同心 圆 的 磁道 (Track) ,一 个 磁道 又 分 为 若干 扇 区 (Sector) 。 虽 然 磁 道 长 
度 不 同 , 但 每 个 磁道 的 扇 区 数 相同 。 图 7. 3 给 出 了 硬盘 结构 和 磁 碟 上 扇 区 分 布 示意 图 。 磁 盘 
中 不 同 磁 碟 上 (磁头 下 ) 的 相同 半径 的 磁道 形成 一 个 柱 面 (Cylinder), 有 若干 个 磁道 就 有 若干 
个 柱 面 。 





图 7.3 硬盘 结构 和 磁 碟 上 扇 区 分 布 示意 图 


从 图 7. 3 可 知 ,作为 物理 介质 的 扇 区 , 指 磁道 上 的 一 段 存储 数据 的 弧 形 区 域 。 传 统 上 , 通 
过 柱 面 号 (Cylinder) 磁头 号 (Head)、 扇 区 号 (Sector) 这 三 维 地 址 来 定位 磁盘 上 的 某 个 扇 区 。 
实际 上 , 柱 面 号 就 决定 了 磁道 号 。 这 种 由 柱 面 号 、 磁 头号 和 扇 区 号 三 者 来 标识 磁盘 中 扇 区 的 方 
式 , 被 简称 为 CHS 编 址 方式 。CHS 三 部 分 构成 扇 区 在 磁盘 上 的 地 址 , 柱 面 号 和 磁头 号 都 从 0 
开始 , 扇 区 号 从 1 开始 。 扇 区 地 址 的 递增 规则 : 首先 是 扇 区 号 ; 然后 是 磁头 号 ; 最 后 是 柱 
面 号 。 

通常 一 个 扇 区 可 以 存储 512 字 节 的 数据 。 因 此 , 扇 区 也 常 作为 度量 单位 ,表示 512 字 节 。 

一 个 磁盘 的 柱 面 数 、 磁 头 数 和 每 个 磁道 的 扇 区 数 ,就 决定 了 磁盘 的 最 大 容量 。 假 设 柱 面 数 
为 c, 磁 头 数 为 ,每 个 磁道 的 扁 区 数 为 ;, 那 么 磁盘 的 最 大 容量 V( 字 节 数 ) 可 以 由 下 式 计算 : 

V 二 每 遍 区 字 节 数 X 扇 区 个 数 
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一 512X 扇 区 个 数 
=512X (cXhXs) 
现在 举例 说 明 具 体 计算 过 程 。 如 果 柱 面 数 c 采用 10 位 二 进 制 表示 ,磁头 数 有 采用 8 位 二 
进 制 表 示 ; 每 道 扇 区 数 采 用 6 位 二 进 制 表示 ,那么 磁盘 的 最 大 容量 可 以 计算 如 下 
V=51l2 X(cXhxs) 
0 
=2 XY 
3 
二 8G( 字 节 ) 
硬盘 技术 发 展 很 快 。 在 存储 容量 方面 ,现在 常常 以 T(1024GB) 为 单位 。 在 存储 介质 方 
面 ,除了 传统 的 机 械 硬 盘 (HDD) 外 ,现在 还 有 固态 硬盘 (SSD) 和 混合 硬盘 (HHD) 等 多 种 类 型 。 
固态 硬盘 不 再 以 磁 碟 作 为 存储 介质 ,而 采用 半导体 存储 器 作为 存储 介质 ,在 固态 硬盘 中 磁道 和 
磁头 等 概念 已 经 失去 早先 的 含义 。 
为 了 适应 发 展 , 现 在 允许 采用 逻辑 块 编 址 (Logical Block Addressing) 方 式 来 标识 硬盘 中 
的 扇 区 。 逻 辑 块 编 址 (LBA) 采 用 一 维 的 逻辑 块 号 ,目前 最 大 可 以 采用 48 位 二 进 制 表示 。 可 以 
认为 ,在 LBA 方式 下 ,硬盘 (控制 器 ) 将 把 一 维 的 LBA 地 址 (逻辑 块 号 ) 转 化 为 三 维 的 CHS 地 
址 ( 柱 面 号 、 磁 头号 、. 扇 区 号 ) 。 一 般 来 说 ,LBA 地 址 (逻辑 块 号 ) 与 CHS 地 址 的 关系 如 下 (起 始 
逻辑 块 号 为 0): 
逻辑 块 号 一 每 道 扇 区 数 X 磁 头 数 X 柱 面 号 十 每 道 扇 区 数 X 磁 头号 十 扇 区 号 一 1 
采用 LBA 编 址 方式 ,在 指定 要 读 写 的 磁盘 扇 区 时 , 相 比 采用 三 维 的 CHS 编 址 方式 ,要 简 
单 , 有 助 于 提高 效率 。 采 用 LBA 编 址 方式 ,也 更 适应 非 磁 性 介质 的 磁盘 。 同 时 ,由 于 表示 
LBA 的 位 数 足 够 多 ,支持 硬盘 的 容量 可 以 “无 限 大 ”。 


7.2.2 磁盘 读 写 


磁盘 的 读 写 操作 也 属于 基本 输入 输出 。BIOS 中 提供 磁盘 读 写 功能 的 程序 被 称 为 磁盘 1/ 
O 〇 程序 。 它 提供 磁盘 的 复位 、 读 、 写 、 校 验 和 格式 化 等 功能 。 与 键盘 输入 1/O 程序 和 显示 输出 
1/O 程序 类 似 , 每 一 个 功能 有 一 个 编号 。 

1. 磁盘 1/O 程序 的 基本 功能 

表 7.4 列 出 了 磁盘 1/O 程序 的 部 分 基本 功能 。 在 调用 磁盘 1/O 程序 时 , 按 调用 的 功能 ， 
设置 好 相应 的 参数 ,把 功能 编号 置信 AH 寄存 器 ,然后 发 出 特定 的 调用 指令 “INT 13H”。 当 
然 ,如 果 为 了 写 数据 到 磁盘 上 去 ,在 发 出 调用 指令 之 前 应 该 先 在 对 应 缓冲 区 中 准备 好 要 写 出 的 
数据 。 调 用 返回 时 ,进位 标志 CF 反映 操作 是 否 成 功 , 如 果 操 作 不 成 功 AH 寄存 器 含有 出 错 状 
态 代 码 。 当 然 ,如 果 是 从 磁盘 读数 据 ,而且 读 成 功 ,那么 在 缓冲 区 中 含有 从 磁盘 读 入 到 内 存 的 
数据 。 

早先 的 PC 有 两 个 软盘 驱动 器 被 分 别称 为 A 盘 和 B 盘 , 所 以 硬盘 的 编号 从 C 开始 ,分 别 
被 称 为 C 盘 和 D 盘 等 。 

【 例 7-8〗 如 下 程序 片段 演示 调用 BIOS 的 磁盘 1/O 程序 从 磁盘 读 一 个 扇 区 到 内 存 指定 
区 域 。 

MV DL gH :8H 表示 5 盘 ( 硬盘 ) 





Sa 


Error 


;ES= 0000 

;ES:BE 缓冲 区 起 始 地 址 ( 段 值 : 偏 移 ) 
;0 面 

0 道 ( 柱 面 ) 

并 1 扇 区 

读 一 个 扇 区 

; 读 功能 ! 

; 读 操作 

;如 读 出 错 , 则 转 


;至 此 ,缓冲 区 0000:7o0H 中 ,含有 读 的 一 个 扇 区 数据 
上 述 程序 片段 读 取 C 盘 中 的 0 道 .0 面 .1 扇 区 到 内 存 起 始 地 址 为 0000:7C00H 的 缓冲 区 。 
为 了 清楚 地 反映 相关 参数 ,所 以 没有 优化 相关 指令 。 如 果 要 写 ,原则 上 只 要 把 功能 号 2 修改 为 
功能 号 3。 请 务必 注意 ,不 要 尝试 写 ( 覆 盖 ) 磁 盘 上 的 0 道 .0 面 1 扇 区 。 


表 7.4 磁盘 1/0 程序 的 部 分 基本 功能 











功 能 入 口 参数 出 口 参 数 说 明 
CF 二 0 表示 复位 成 功 ，| 部 分 状态 代码 : 
AH=0 pe AH=00H; 05H: 复位 失败 
磁盘 系统 复位 81H 表示 D 盘 CF 二 1 表示 复位 失败 ,| 80H: 超时 
AH 一 状态 代码 AAH: 驱动 器 未 准备 好 
DL 王 驱动 器 号 
ES= 缓 冲 区 地 址 段 值 驱动 器 号 : 
BX 一 缓冲 区 地 址 偏 移 CF==0 表示 读 成 功 ， 80H 表示 C 盘 
AH=2 AL 一 扇 区 数 缓冲 区 含 读 人 数据 ; 81H 表示 D 盘 
读 扇 区 DH= 磁 头号 CF 一 1 表示 读 出 错 ， 柱 面 号 .磁头 号 、 扇 区 
CH= 柱 面 号 ( 低 8 位 ) AH= 出 错 代 码 号 ,指定 首 个 扇 区 的 
CL( 高 2 位 )= 柱 面 号 (高 2 位 ) 地 址 
CL( 低 6 位 )= 扇 区 号 
AH=3 缓冲 区 含 写 出 数据 ne 
写 扇 区 其 他 同上 











AH 一 出 错 代码 


从 表 7. 4 所 列 的 入 口 参数 可 知 ,在 调用 磁盘 1/O 程序 读 写 磁盘 时 ,磁盘 柱 面 号 最 大 为 
1023 ,磁头 号 最 大 为 255, 扇 区 号 最 大 为 63, 所 以 不 能 读 写 大 容量 的 磁盘 。 

2. 磁盘 1/O 程序 的 扩展 功能 

为 了 更 好 地 支持 读 写 磁盘 ,现在 BIOS 的 磁盘 IO 程序 都 提供 扩展 功能 。 在 调用 扩展 功能 
时 ,往往 要 用 到 磁盘 地 址 数据 包 (Disk Address Packet,DAP)。 表 7.5 给 出 了 DAP 的 组 织 结构 。 


表 7.5 DAP 的 组 织 结构 





字段 名 称 字 节 数 含 要 

PacketSize 1 地 址 包 尺寸 (16 字 节 ) 

Reserved 保留 (0) 

BlockCount 2 传输 数据 块 个 数 ( 扇 区 个 数 ? 
BufferAddr 4 传输 缓冲 区 起 始 地 址 ( 段 值 : 偏 移 ) 
BlockNum 8 磁盘 起 始 绝 对 块 地 址 
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其 中 , 首 个 字 节 PacketSize 给 出 DAP 自身 的 尺寸 ,以 便 将 来 对 其 进行 扩充 。 在 目前 使 用 
的 磁盘 1/O 程序 中 ,PacketSize 等 于 16 ,表示 DAP 由 16 个 字 节 构成 。BlockCount 是 2 字 节 
项 ,给 出 要 读 写 的 数据 块 个 数 , 可 以 认为 就 是 要 读 写 的 磁盘 扇 区 数 。 当 BlockCount 为 0 时 , 表 
示 不 读 写 任何 数据 块 。BufferAddr 是 4 字 节 项 ,给 出 数据 缓冲 区 起 始 地 址 的 段 值 和 偏 移 , 数 
据 缓冲 区 必须 位 于 常规 内 存 中 (地 址 小 于 1MB)。BlockNum 是 8 字 节 项 ,可 以 表示 足够 大 的 
值 ,由 它 表 示 读 写 数据 块 在 磁盘 上 的 起 始 地 址 ,也 就 是 起 始 扇 区 的 逻辑 块 地 址 (LBA) ,该 项 可 


以 表示 足够 大 的 值 。 


磁盘 I/O 程序 的 部 分 扩展 功能 列 于 表 7.6。 从 表 7.6 中 可 知 , 读 磁盘 和 写 磁盘 的 功能 ,都 
基于 磁盘 地 址 数据 包 (DAP)。 由 于 DAP 中 表示 读 写 扇 区 的 地 址 采用 LBA 形式 ,并 且 可 以 足 
够 大 ,因此 利用 磁盘 I/O 程序 的 扩展 功能 读 写 磁盘 ,不 但 方便 ,而 且 可 以 读 写 “无 限 大 ”的 




















磁盘 。 
表 7.6 磁盘 I/O 程序 的 部 分 扩展 功能 
功 能 入 口 参数 出 口 参 数 说 明 
CF=0, 有 BX=AA55h 
表示 支持 扩展 功能 ， 
AH 一 4 | pL 一 驱动 器 号 AH 一 扩展 功能 主 版 本 到 到 本 
检验 是 否 存 加 下 80H 表示 C 盘 
才 扩 展翅 能 BX=55AAh AL= 扩 展 功能 次 版 本 81H 表 示 D 盘 
CX( 位 0)= 扩 展 功能 的 子 集 1 或 2 
CF==1, 表 示 不 支持 扩展 功能 
Ew CF==0 表示 读 成 功 ， 如 出 现 错误 , DAP 
AH=42h ee ee 这 明 的 BlockCount 项 中 
读 肩 区 CA CF=1 表示 读 出 错 ， 则 记录 了 出 错 前 实 
AH= 出 错 代 码 际 读 取 的 扇 区 个 数 
其 他 同上 CF==0 表示 写成 功 ， 如 出 现 错误 , DAP 
AH=43 AL( 位 0)=0 表示 关闭 写 校 验 | AH=0; 的 BlockCount 项 中 
写 扇 区 三 1 表示 打开 写 校 验 | CF=1 表示 写 出 错 ， 则 记录 了 出 错 前 实 
AL( 位 1 一 位 7) 保留, 置 0 AH 一 出 错 代码 际 写 出 的 扇 区 个 数 


【 例 7-9】 如 下 程序 片段 演示 利用 磁盘 1/O 程序 的 扩展 功能 ,从 磁盘 读 扇 区 到 内 存 指定 


区 域 。 


MV 从 G 
MV DSA 
MV Sl, DAPacket 
MV DL aH 
WwW A 
INT 13 

J Error 


:假设 pp 与 代码 同一 个 段 
;指向 磁盘 地 址 包 DP 
;准备 从 C 盘 读 
准备 调用 扩展 的 读 功能 ! 
; 读 操作 

;如 读 出 错 , 则 转移 


假设 上 述 程 序 片 段 所 使 用 的 DAP 如 下 : 


DAPacket: 
中 16 
中 0 
d 2 


由 (123H<< 19 +508H 


;DAP 自身 W6 个 字 节 
;DIP 保留 字 节 
; 读 写 两 个 扇 区 


;缓冲 区 起 始 地 址 ( 段 值 234 偏 移 56781) 





dH 例 起 始 扇 区 [BA 为 好 
dd 0 :起 始 扇 区 LBA 的 高 位 为 0 
那么 在 执行 上 述 程序 片段 后 ,将 把 C 盘 上 的 第 158 号 扇 区 开始 的 两 个 扇 区 , 读 到 起 始 地 
位 为 1234:5678H 的 内 存 区 域 。 


7.2.3 主 引 导 记 录 分 析 


主 引导 记录 (Main Boot Record) 是 位 于 启动 磁盘 首 个 扇 区 的 引导 程序 。 启 动 磁盘 是 指 启 
动 操作 系统 的 磁盘 , 首 扇 区 是 指 在 LBA 编 址 方式 下 逻辑 块 号 为 0 的 扇 区 ,或 者 在 CHS 编 址 方 
式 下 的 0 道 .0 面 、1 号 扇 区 的 扇 区 。 

在 PC 启动 的 过 程 中 ,在 完成 加 电 自 检 (POST) 等 处 理 后 ,BIOS 将 按照 预定 的 启动 顺序 ， 
读 取 主 引导 记录 到 起 始 地 址 为 0000:7C00H 的 内 存 区 域 ,并 转 到 主 引 导 程 序 执行 ,也 即 转 到 
0000:7C00H 处 执行 。 

本 节 分 析 主 引导 记录 的 部 分 代码 ,在 总 结 回顾 相关 技术 方法 的 同时 ,为 介绍 虚拟 机 和 虚拟 
磁盘 做 准备 。 

1. 功能 和 组 成 

通常 MBR 将 把 操作 系统 的 引导 程序 装载 到 内 存 , 并 转 操作 系统 的 引导 程序 。 随 后 ,由 操 
作 系 统 引导 程序 完成 操作 系统 的 自 举 。 这 样 安排 ,可 以 实现 在 一 个 硬盘 上 安装 多 个 操作 系统 ， 
当然 只 能 有 一 个 活动 的 操作 系统 。 

位 于 磁盘 首 扇 区 的 MBR 长 度 为 512 字 节 。 传 统 的 主 引导 记录 由 主 引导 程序 (446 字 节 )、 
磁盘 分 区 表 (64 字 节 ) 和 标记 (2 字 节 ) 三 部 分 组 成 。 最 后 的 标记 供 BIOS 程序 识别 用 ,采用 十 
六 进 制 表示 一 定 是 55 和 AA。 

2. 执行 步 又 

在 由 BIOS 转 到 位 于 起 始 地 址 0000:7C00H 的 主 引导 程序 后 , 主 引导 程序 执行 的 主要 步 
又 如 下 。 

(1) 自身 腾挪 。 由 于 操作 系统 的 引导 程序 将 占用 起 始 地 址 为 0000:7C00H 的 内 存 区 域 ， 
因此 MBR 自身 必须 搬迁 到 另 一 个 内 存 区 域 。 

(2) 识别 活动 分 区 。 根 据 磁盘 分 区 表 的 相关 信息 ,识别 出 当前 活动 分 区 ,也 即 要 启动 的 操 
作 系 统 所 在 的 分 区 ,为 加 载 操作 系统 的 引导 程序 做 准备 。 

(3) 加 载 引 导 程 序 。 利 用 作为 BIOS 的 磁盘 1/O 程序 , 读 取 位 于 活动 分 区 的 操作 系统 的 
引导 程序 。 

(4) 跳 转 到 操作 系统 的 引导 程序 。 

现 以 Windows 7(32 位 版 本 ) 的 启动 硬盘 上 的 MBR 为 例 , 分 析 相 关 代码 。 

3. 自身 腾挪 

下 列 是 MBR 的 开始 部 分 ,采用 反 汇 编 的 形式 。 第 一 列 是 内 存 地 址 ,第 二 列 是 机 器 码 , 第 
三 列 是 汇编 格式 的 指令 ,其 中 数据 都 采用 十 六 进 制 表示 。 为 了 便于 阅读 理解 ,添加 了 以 分 号 引 
导 的 注释 。 


0000:7000 ”3900 XR 以 以 ;AE0 
0000:700 D0 MW SSM ; 置 堆栈 段 值 
0000:7004 -BOO MW Sp, WO ; 置 堆栈 底 
0000:7007 EE00 MYV Ex ;目标 段 值 
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O00:709 E08 MW DSM ; 源 段 值 

0000:700B ”BEOOTC MV SI, WO 源 偏 移 

0000:7O0E ”BF0006 MN DI, 000 ;目标 偏 移 

0000:7011 -B90002 MW x 0200 ;数据 块 字 节 数 512 
000:714 FC QD ;由 低 向 高 调整 
O000:7015 FM REPz MNVSB ;复制 ER 

0000:7017 50 PUSH AX ;目的 地 址 段 值 ( 0000H) 
0000:718 B1006 PUSH 06C ;目的 地 址 偏 移 ( 0610H) 
0000:7IB B RETF ; 转 到 内 存 0000:06IQH 处 


从 上 述 代 码 可 知 ,首先 它 把 自身 512 字 节 从 起 始 地 址 为 0000:7C00H 的 内 存 区 域 复制 到 
起 始 地 址 为 0000:0600H 的 内 存 区 域 。 由 于 源 区 域 和 目标 区 域 不 重 倒 ,因此 块 复制 比较 简单 ， 
在 设置 好 源 起 始 地 址 和 目标 起 始 地 址 后 ,采用 带 重复 前 级 的 字符 串 传 送 指令 完成 复制 。 然 后 
跳 转 到 新 区 域 的 恰当 位 置 继续 执行 。 把 新 地 址 的 段 值 和 偏 移 分 别 压 入 堆栈 ,接着 通过 段 间 返 
回 指令 实现 跳 转 。 新 起 点 的 偏 移 为 061CH ,就 是 紧 随 RETF 之 后 的 指令 。 如 上 所 示 ,指令 
RETF 所 在 偏 移 为 7C1BH ,在 MBR 迁移 到 起 始 地 址 为 0000:0600H 的 新 区 域 后 ,该 RETF 指 
令 所 在 偏 移 就 变 成 061BH 。 

4. 识别 活动 分 区 

磁盘 分 区 是 指 磁 盘 上 一 段 连 续 的 以 扇 区 为 单位 的 存储 区 域 。 一 个 物理 磁盘 可 以 被 划分 为 
多 个 分 区 。 操 作 系 统 引导 程序 的 第 一 部 分 ,位 于 其 所 在 磁盘 分 区 的 首 个 扇 区 。 在 采用 磁盘 分 
区 之 后 ,在 一 个 物理 磁盘 上 可 以 安装 多 个 操作 系统 。 

在 主 引 导 记 录 MBR 的 尾部 (相对 位 置 01BEH 处 开始 ) 有 一 张 由 64 字 节 构成 的 磁盘 分 区 
表 (Disk Partition Table,DPT)。 它 包含 4 项 ,每 项 16 个 字 节 ,用 于 记录 一 个 磁盘 分 区 的 信 
息 。 由 16 个 字 节 构成 的 磁盘 分 区 信息 的 含义 如 下 。 

(1) 首 字 节 是 活动 分 区 标记 。 如 果 该 分 区 为 活动 分 区 ,标记 值 就 是 物理 驱动 器 号 ,80H 代 
表 C 盘 ,81H 代表 DD 盘 。 如 果 该 分 区 为 非 活动 分 区 , 则 标记 值 为 0。 

(2) 第 1.2 和 3 字 节 是 CHS 编 址 形式 的 该 分 区 首 扇 区 的 地 址 。 其 中 ,第 1 字 节 是 磁头 
号 ; 第 2 字 节 的 低 6 位 是 扇 区 号 ,高 2 位 是 柱 面 号 的 高 2 位 ; 第 3 字 节 是 柱 面 号 的 低 8 位 ( 柱 
面 号 采用 10 位 表示 ) 。 

(3) 第 4 字 节 是 分 区 的 文件 系统 标记 。 该 字 节 也 用 于 表示 扩展 分 区 。 

(4) 第 5.6、7 字 节 是 CHS 编 址 形式 的 该 分 区 末 扇 区 的 地 址 。 

(5) 第 8 一 11 字 节 ( 共 4 字 节 ) 是 LBA 编 址 形式 的 该 分 区 首 扇 区 的 地 址 ,也 就 是 该 分 区 首 
扇 区 之 前 已 占用 的 扇 区 数 。 

(6) 第 12 一 15 字 节 ( 共 4 字 节 ) 是 该 分 区 占用 的 扇 区 数 。 

综 上 所 述 ,在 完成 自身 腾挪 之 后 ,将 跳 转 到 0000:061CH 处 执行 ,进行 第 二 步 工 作 ,识别 活 
动 分 区 。 对 应 的 反 汇编 代码 如 下 ,格式 说 明 同上 。 


0000:06C 已 SI ; 开 中 断 
0000:05ID -B90400 WW 以 4 ;分 区 表 含 4 项 
0000:0620 ”EDBEO7 MV Bp OBE ;指向 分 区 表 首 项 

( O00+ OfBEH) 
0000:0673 807E0000 QP ”BYTE [BP+ 001,0 ;检查 分 区 标志 
0000:027 TOB 山 084 活动 分 区 , 转 下 一 步 
0000:0529 ”OF850E01 JE 0B 非法 分 区 , 转 出 错 处 理 





0000:0D ”830510 AD Bp 0 ;指向 分 区 表 中 下 一 项 
0000:0690 ET1 LOOP 083 ;循环 ,判断 下 一 表 项 
0000:0682 CD18 INT 18 沁 动 特定 程序 ! 


从 上 述 代码 可 知 ,采用 一 个 循环 依次 检查 分 区 信息 表 项 中 的 首 字 节 ( 活 动 分 区 标记 )。 把 
第 一 个 标记 值 为 负 的 分 区 认定 为 当前 活动 分 区 。 实 际 上 ,硬盘 驱动 器 号 80H 和 81H 等 ,其 最 
高 位 为 1 ,如果 将 其 看 作 有 符号 数 ,那么 就 是 负数 。 

非 活动 分 区 的 标记 值 应 该 为 0, 否则 认为 出 现 错误 。 如 果 没 有 找到 活动 分 区 ,那么 就 转 
BIOS 中 的 特定 程序 执行 。 

5. 加 载 引 导 程 序 

在 确定 当前 活动 分 区 之 后 ,就 开始 引导 当前 活动 分 区 的 操作 系统 。 实 际 上 是 加 载 位 于 当 
前 活动 分 区 首 扇 区 的 操作 系统 引导 程序 。 加 载 引 导 程 序 的 大 致 策略 是 : 如 果 磁 盘 I/O 程序 支 
持 扩展 功能 ,那么 利用 扩展 功能 读 取 引导 程序 ,否则 通过 基本 功能 读 取 引 导 程 序 ; 为 了 稳妥 ， 
如 果 读 操作 失败 ,那么 在 复位 磁盘 驱动 器 后 ,再 次 读 取 ; 如 果 多 次 尝试 都 失败 ,确实 就 失败 了 。 
加 载 引导 程序 的 具体 代码 如 下 。 

(1) 判断 磁盘 1/O 程序 是 否 支 持 扩 展 功 能 。 试 探 性 地 调用 磁盘 I/O 程序 的 41H 号 功能 
来 检测 。 如 果 不 支 持 扩 展 功能 ,那么 返回 时 进位 标志 CF 被 置 位 ; 即使 CF 被 清 ,还 进一步 判 
断 作 为 出 口 参 数 的 寄存 器 BX 的 值 , 如 果 支 持 扩展 功能 ,其 值 应 该 是 55AAH。 


0000:0634 ” 8850 MV [BP+r00], DL ;保存 驱动 器 号 

0000:0687 ”于 PUSH Bp 

0000:0638 ”06461105 MN ”BYTE [BEP+ 们 ,5 ， ;尝试 多 次 读 的 计数 初 值 5 
0000:0630 ”06461000 MN ”BYTE [BP+ 10],0 ”; 先 假设 INTI3H 无 扩展 功能 

0000:0640 -B441 MV AH 4 ;检测 存在 INTI3H 的 扩展 功能 
0000:062 BBAA55 MW BX 55A ;作为 人 口 参 数 

0000:0%45 CD13 IN 13 ;调用 INT131 

0000:07 加 POP ” 即 

0000:048 TXF B 0 ;根据 fF 判断 不 存在 扩展 功能 ,转移 
0000:06A 8IFB55AA QP BX AM55 ;根据 特定 值 判断 

0000:0E 759 JZ 0 ;不 存在 扩展 功能 ,转移 

0000:060 -F7010100 TEST CX O00l 浏 断 扩展 功能 子 集 

0000:0654 -7408 全 0 ; 仅 扩展 功能 子 集 1, 转 移 

0000:0656 FE4610 INC EYE [BP+ 10] ;标记 : INTIH 有 扩展 功能 

(2) 读 活 动 分 区 的 首 个 扇 区 , 即 操作 系统 引导 程序 。 为 了 调用 磁盘 1/O 程序 的 扩展 功能 


读 扇 区 , 先 在 堆栈 顶 形 成 一 个 磁盘 地 址 数据 包 DAP。 为 此 ,从 当前 活动 分 区 表 项 中 取得 LBA 
编 址 形式 的 分 区 首 扇 区 的 地 址 ,填写 到 DAP 中 ; 还 把 0000:7C00H 作为 缓冲 区 首 地 址 填写 到 
DAP 中 。 如 果 采 用 基本 功能 读 扇 区 ,那么 就 从 当前 活动 分 区 表 中 取得 CHS 编 址 形式 的 分 区 
首 扇 区 的 地 址 ,直接 将 其 作为 人口 参 数 。 


0000:059 ”600 PUSHAD ;保存 通用 寄存 器 
0000:04B 80E1000 QP ”BYE [BP+ 10], 0 ;可否 利用 INTIH 扩 展 功 能 
0000:0F 76 凤 087 ;不 能 使 用 , 则 转移 
:------------------------- ;利用 INTIH 扩 展 功能 读 
(0000:0661 ”656800000000 PUSH ”00000000 ;DP 中 LA 扇 区 号 高 4 字 节 
0000:0667 6FF760B PUSH DWORD [BPr 08] ;DP 中 LA 扇 区 号 低 4 字 节 


0000:05B ”680000 PUSH om ;DAP 中 缓冲 区 地 址 的 段 值 
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0000:0E 68007C PusH 700 ;DAP 中 缓冲 区 地 址 的 偏 移 
0000:0671 ”680100 PUSH 000 ;DAP 中 的 所 读 扇 区 数 
0000:0674 681000 PUSH oo0 ;DAIP 尺 寸 及 保留 字 节 
0000:0677 -B42 MW A ;扩展 的 读 功 能 

0000:059 8A5600 My DL [epr 00] ;驱动 器 号 

0000:060 EEF4 MW Sl,Sp :指向 DP 

0000:05E ”CD13 INT 13 ;调用 INT13H, 读 ! 

0000:080 和 LAF ;保存 状态 标志 

0000:0681 ”830410 AD SP 10 平衡 堆栈 

0000:084 和 SAF ;恢复 状态 标志 

0000:0685 ”EB14 JP 0%B ;继续 
bbb ;利用 INTIH 基 本 功能 读 
0000:0687 。BB0IO2 MY AX Ol ; 读 一 个 扇 区 

0000:Q4BA BBOIC MW BX 700 ;存放 到 70H 处 

0000:04D 8A5600 MY DL [BP+ 00] ;驱动 器 号 

0000:0490 8A7601 MV DH [BPr o 叫 ;磁头 号 H 

0000:093 ”8WMEOZ MV  Q, [BPr 02] ; 扇 区 号 S 

0000:06 8MED3 MY QH [Bpr 08] ; 柱 面 号 C 

0000:099 ”CD13 INT 13 ;调用 INT13, 读 ! 
:------------------------- 浏 断 是 否 读 成 功 
0000:09B 6 POPAD ;恢复 寄存 器 

0000:08D 731C JB 0E8 ; 读 成 功 , 转 下 一 步 
-一 -一 -一 ; 读 操作 失败 ,复位 驱动 器 ,再 尝试 读 操作 
O000:08F FE4E11 DEC BYTE [BP+ 1] ;计数 减 1 

0000:042 7500 JZ 0 ;不 为 0 转移 
:------------------------- 瘟 后 青 次 确认 C 盘 驱动 器 
0000:06M 807E00B0 QP ”BYTE [BP+ 00] ,8 ;当前 就 是 C 盘 吗 ? 
0000:068 OF848A00 上 0% ;确认 C 盘 , 则 转 失败 处 理 
0000:0C 。B280 MV Dm ;否则 ,考虑 C 盘 
0000:0AE 。EB84 JP 0 尝试 从 5C 盘 ,启动 系统 
:------------------------- ;复位 驱动 器 

0000:0B0 于 PusH Bp ; 

0000:0B1 3E4 XR 有 用 ;0 号 功能 是 复位 驱动 器 
0000:08B3 ”8A5600 MY DL, [LBPr 00] ;驱动 器 号 

0000:0B6 ”CD13 INT 13 ;复位 驱动 器 

0000:088 名 POP BB ; 

0000:0B? EBFE JP 0 ;尝试 下 一 次 读 操 作 


(3) 检查 所 读 引 导 程 序 的 标记 。 作 为 操作 系统 引导 程序 , 按 约定 扇 区 最 后 2 字 节 应 该 是 
特定 标记 55H 和 AAH。 如 果 无 此 标记 ,表示 并 非 操作 系统 的 引导 程序 。 

0000:08B8 8I3HFETD55AA OP WORD [TDFE|，AA5 

000:00 FE JIZ al ;无 标记 , 转 出 错 处 理 

6. 跳 转 到 操作 系统 的 引导 程序 

在 成 功 把 操作 系统 的 引导 程序 加 载 到 起 始 地 址 为 0000:7C00H 的 内 存 区 域 后 ,利用 以 下 
无 条 件 段 间 转移 指令 跳 转 到 操作 系统 的 引导 程序 。 

O000:07A EMO WP 0000:7000 





7. 其 他 
当 确认 磁盘 分 区 表 项 无 效 . 读 磁 盘 操 作 失 败 或 者 首 扇 区 并 非 操 作 系统 引导 程序 时 ,将 调用 
属于 BIOS 的 显示 1/O 程序 ,在 屏幕 显示 相应 的 提示 信息 ,随后 挂 起 执行 。 


7.3 虚 拟 机 


可 以 认为 虚拟 机 就 是 一 个 模拟 计算 机 系统 的 软件 。 借 助 虚拟 机 ,可 以 相对 方便 地 调试 与 
计算 机 系统 硬件 密切 相关 的 软件 ,如 设备 驱动 程序 操作 系统 自身 等 。 本 节 简 要 介绍 虚拟 机 的 
实现 原理 和 虚拟 硬盘 文件 ,并 介绍 直接 写 屏 显示 方式 。 


7.3.1 虚拟 机 工作 原理 


虚拟 与 真实 相对 。 在 虚拟 之 外 ,虚拟 就 是 假 ; 在 虚拟 之 中 ,虚拟 就 是 真 ( 源 自 网 络 文献 ) 。 

1. 虚拟 机 及 其 作用 

虚拟 机 (Virtual Machine) 是 指 由 软件 模拟 的 具备 硬件 系统 功能 的 可 独立 运行 程序 的 计算 
机 系统 。 虚 拟 机 并 非 真 实 的 计算 机 系统 ,本 质 上 它 是 一 个 软件 。 由 软件 模拟 的 计算 机 系统 ,可 
以 包括 CPU 内存、 硬盘 网卡 和 其 他 设备 等 。 在 虚拟 机 上 ,通常 可 以 运行 各 种 原先 运行 在 真 
实 计算 机 上 的 软件 。 虽 然 在 虚拟 机 之 外 ,这 个 计算 机 就 是 假 的 ,但 是 在 虚拟 机 之 内 ,这 个 计算 
机 却 是 真 的 。 

把 运行 虚拟 机 这 个 软件 的 计算 机 称 为 宿主 机 (Host) 。 虚 拟 机 的 运行 当然 需要 使 用 宿主 
机 的 各 种 资源 ,包括 CPU 和 内 存 , 也 包括 键盘 和 显示 器 等 外 部 设备 ,虚拟 机 的 运行 效果 与 宿 
主机 的 硬件 资源 有 密切 关系 。 在 一 台 宿 主机 上 ,可 以 运行 多 个 虚拟 机 。 在 宿主 机 上 ,可 以 运行 
模拟 其 他 软 硬 件 平台 的 虚拟 机 。 更 有 其 者 ,宿主 机 本 身 是 虚拟 机 。 

目前 流行 的 虚拟 机 软件 有 VMware Workstation、VirtualPC 和 VirtualBox, 它 们 都 能 在 
Windows 系统 上 虚拟 出 多 个 计算 机 。 在 这 些 虚拟 机 上 可 以 安装 和 使 用 Windows、Linux 或 其 
他 操作 系统 。 在 这 些 虚拟 机 上 ,可 以 运行 多 种 应 用 系统 ,也 可 以 运行 相应 的 开发 工具 。 利 用 虚 
拟 机 ,可 以 实现 平台 交叉 的 设计 开发 。 

如 果 不 在 虚拟 机 上 安装 操作 系统 ,那么 虚拟 机 就 相当 于 一 台 裸 机 ,或 者 只 具有 BIOS 的 机 
器 。 在 设计 开发 像 操 作 系统 .设备 驱动 程序 这 样 的 软件 时 ,经 常 需要 没有 操作 系统 的 环境 , 因 
为 只 有 这 样 才能 不 受 限 制 地 运行 被 调试 的 底层 程序 ,或 者 执行 需要 特权 的 指令 。 在 Windows 
平台 上 ,不 能 够 跳 过 Windows 直接 访问 计算 机 系统 的 硬件 资源 ,也 不 能 直接 调用 BIOS 进行 
输入 或 输出 。 利 用 虚拟 机 ,可 以 较 好 地 解决 这 一 问题 。 借 助 虚拟 机 VirtualBox 和 Bochs, 本 书 
介绍 中 断 处 理 程序 的 开发 ,讲解 保护 方式 程序 的 设计 。 

2. 虚拟 机 的 工作 原理 

虚拟 机 是 软件 ,在 虚拟 机 上 和 运行 程序 , 换 句 话说 就 是 由 一 个 软件 运行 另外 一 个 软件 。 按 虚 
拟 机 “执行 ”指令 的 方式 ,有 两 种 实现 虚拟 机 的 方法 : 纯 软件 的 方法 和 硬件 辅助 的 方法 。 

纯 软 件 的 方法 是 完全 由 软件 模拟 CPU 执行 指令 。 一 个 主 程序 表现 为 虚拟 机 的 CPU ,其 
各 种 寄存 器 由 一 组 全 局 变量 来 代替 。 每 一 条 不 同 操作 码 的 机 器 指令 ,由 一 个 对 应 的 子 程序 来 
模拟 ,操作 数 作为 对 应 子 程序 的 参数 。 虚 拟 机 的 内 存 由 一 个 足够 大 的 全 局 一 维 数组 来 代替 。 
作为 虚拟 机 CPU 的 主 程序 ,可 以 根据 指令 编码 识别 出 每 条 机 器 指令 ,然后 调用 对 应 的 子 程 
序 ,模拟 指令 的 执行 。 
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纯 软 件 的 方法 实现 起 来 相对 简单 ,而 且 可 以 虚拟 出 与 宿主 机 不 同类 型 CPU 的 虚拟 机 。 
缺点 是 这 样 的 虚拟 机 效率 很 低 。 实 际 上 ,原本 执行 一 条 机 器 指令 ,现在 变 为 执行 一 个 模拟 子 程 
序 ; 原本 只 需要 一 个 时 钟 周期 ,现在 变 为 几 十 个 甚至 几 百 个 时 钟 周期 。 同 时 ,这 种 虚拟 机 很 难 
体现 诸如 高 速 缓存 .流水 线 等 为 提高 CPU 执行 效率 的 机 制 。 但 是 , 随 着 计算 机 技术 发 展 宿主 
机 自身 各 项 性 能 获得 大 幅 提升 ,所 以 基于 宿主 机 的 虚拟 机 仍然 能 够 有 良好 的 表现 。 

虚拟 机 Bochs 是 典型 的 纯 软 件 类 型 的 虚拟 机 。 在 Windows 平台 上 利用 虚拟 机 Bochs ,可 
以 运行 或 调试 设备 驱动 程序 等 。 

虽然 纯 软 件 的 虚拟 机 能 够 有 良好 的 表现 ,但 毕 竞 大 大 降低 了 宿主 机 的 效率 。 为 此 提出 了 
硬件 辅助 的 虚拟 化 技术 。 这 种 方法 是 程序 中 少量 特权 指令 或 者 特殊 指令 由 软件 模拟 执行 , 程 
序 中 大 量 普 通 指令 仍然 由 宿主 机 CPU 直接 执行 。 当 宿主 机 CPU 发 现 需要 由 软件 模拟 执行 
的 特权 指令 或 者 特殊 指令 时 ,转交 给 模拟 子 程序 。 

硬件 辅助 的 方法 实现 起 来 比较 复杂 ,而 且 虚拟 机 往往 还 需要 获得 宿主 机 CPU 的 额外 支 
持 。 从 IA-32 系列 CPU 的 Pentium4 开始 ,部 分 型 号 的 CPU 就 具备 了 VT(Virtualization 
Technology) 技 术 ,以 支持 实现 虚拟 机 。 优 点 是 这 样 的 虚拟 机 效率 高 ,与 宿主 机 自身 相 比 ,效率 
只 是 稍 有 下 降 。 


7.3.2 虚拟 硬盘 文件 


虚拟 机 也 可 以 配备 硬盘 。 为 虚拟 机 配备 的 硬盘 也 是 虚拟 的 ,被 称 为 虚拟 硬盘 。 为 虚拟 机 
配置 的 虚拟 硬盘 ,往往 由 宿主 机 上 的 磁盘 文件 来 模拟 ,这 样 的 文件 被 称 为 虚拟 硬盘 文件 。 

在 为 虚拟 机 配备 这 样 的 硬盘 后 ,在 虚拟 机 上 运行 的 程序 , 当 它 读 写 虚 拟 机 硬盘 上 的 文件 
时 ,或 者 当 它 直接 存 取 虚拟 机 硬盘 上 的 数据 时 ,由 虚拟 机 转化 为 对 虚拟 硬盘 文件 的 访问 。 在 虚 
拟 机 上 运行 的 程序 ,并 不 知道 机 器 系统 是 虚拟 的 ,当然 也 不 知道 硬盘 设备 是 虚拟 的 。 

有 多 种 虚拟 机 软件 ,有 多 种 类 型 的 虚拟 硬盘 文件 。 一 种 虚拟 机 (软件 ) 常 常会 支持 多 种 不 
同类 型 的 虚拟 硬盘 文件 。 虚 拟 硬盘 文件 的 种 类 是 指 采用 的 规范 (标准 ) ,本质 上 是 指 文件 的 数 
据 存 储 组 织 格式 。 不 同 种 类 虚拟 硬盘 文件 的 区 别 是 文件 数据 格式 的 不 同 。 虚 拟 硬 盘 文件 名 的 
后 缀 ,往往 反映 虚拟 硬盘 文件 的 种 类 。 

微软 公司 推出 的 虚拟 硬盘 文件 采用 名 为 VHD(CVirtual Hard Disk) 的 规范 (标准 ) ,其 文件 
扩展 名 是 . vhd, 这 是 常用 的 虚拟 硬盘 文件 类 型 。 本 书 使 用 的 虚拟 机 VirtualBox 和 虚拟 机 
Bochs 都 支持 VHD 类 型 的 虚拟 硬盘 文件 。 

VHD 类 型 的 虚拟 硬盘 文件 又 分 为 两 种 : 固定 大 小 的 和 动态 分 配 的 。 为 了 简单 化 ,本 书 采 
用 VHD 类 型 的 固定 大 小 的 虚拟 硬盘 文件 。 这 种 虚拟 硬盘 文件 结构 相当 简单 : 每 个 扇 区 是 
512 字 节 ; 文件 中 首 个 512 字 节 对 应 LBA 地 址 (逻辑 块 号 ) 为 0 的 扇 区 ,随后 的 512 字 节 对 应 
LBA 地 址 为 1 的 扇 区 ,依次 递增 。 只 有 末尾 的 512 字 节 是 非 数 据 扇 区 ,而 是 VHD 文件 的 格式 
信息 。 格 式 信息 包括 : 标识 字符 串 “conectix”, 用 于 标识 VHD 类 型 ; VHD 版 本 、 创 建 日 期 和 
创建 程序 等 ; 虚拟 硬盘 参数 ( 柱 面 数 、 磁 头 数 和 每 磁道 扇 区 数 ) 和 虚拟 硬盘 容量 等 。 

对 虚拟 机 而 言 ,虚拟 硬盘 文件 就 是 硬盘 ,但 是 对 其 他 软件 而 言 ,虚拟 硬盘 文件 就 是 一 个 普 
通 数据 文件 。 本 书 提 供 了 一 个 小 工具 VHDWriter, 它 能 够 把 目标 代码 或 者 数据 等 , 写 到 某 个 
VHD 类 型 虚拟 硬盘 文件 的 指定 扇 区 。 具 体 的 使 用 方法 ,请 见 10. 4 节 的 介绍 。 


【 例 7-10】 简单 演示 虚拟 机 和 虚拟 硬盘 的 工作 。 
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如 7.2.3 节 所 述 ,在 PC 启动 过 程 中 ,将 读 取 硬盘 上 的 主 引 导 记 录 到 起 始 地 址 为 0000: 
7C00H 的 内 存 区 域 ,并 转 到 该 处 执行 。 虚 拟 机 也 是 如 此 。 演 示 思 路 为 : 编写 一 个 显示 Hello 
信息 的 程序 ,将 该 程序 的 目标 代码 作为 虚拟 硬盘 的 主 引导 记录 ; 在 启动 虚拟 机 后 ,这 个 特殊 的 
主 引 导 记 录 会 被 装 和 人 到 虚拟 机 的 起 始 地 址 为 0000:7C00H 的 内 存 区 域 ,并 得 到 执行 。 

本 例 的 虚拟 机 具备 BIOS, 但 虚拟 硬盘 上 没有 安装 任何 操作 系统 ,只 有 一 个 所 谓 的 主 引导 
记录 , 它 并 不 引导 任何 系统 ,仅仅 演示 说 明 它 自身 获得 了 执行 。 

可 以 作为 “ 主 引导 ?记录 的 源 程序 dp74. asm 如 下 : 


section text 
bits 16 ;6 位 段 模式 
Begin: ;启动 点 
MW Bo 指定 显示 页 0 
MW D5 ;光标 行 号 ( 5 行 ) 
WW DL8 ;光标 列 号 ( 8 列 ) 
W AL 2 ;2 号 功能 设置 光标 位 置 
INT 10H ;定位 光标 到 指定 位 置 
QD 闻 符 串 操作 方向 
WW ACs 
WW Ds 以 数据 段 与 代码 段 一 臻 
MY SI, hello ;指向 字符 串 首 ( 代码 段 的 相对 地 址 ) 
AD Sl, WOH 指向 字符 串 首 ( 内 存 中 的 固定 地 地 Me1 
Lab1: 
LODSB ; 取 一 个 字符 
RR LA 浏 断 结束 标记 
凤 Lab2 症 , 跳 转 结束 
W M4 
INT 10 ;TY 方式 显示 字符 
JWP SHORT Labl ;继续 
Lab2: 
Over: 
JP ”Over ;进入 无 限 循环 
hello 中 “Helloworld" ,0 
times 50- ($- $$) 中 0 :填充 0, 直到 满 50 字 节 
中 5 Qeah 最 后 2 字 节 ,共计 52 字 节 


上 述 程 序 由 代码 和 数据 两 部 分 构成 。 代 码 部 分 的 主要 工作 是 调用 BIOS 的 显示 1/O 程序 
输出 指定 的 信息 : 首先 设 定 光 标 位 置 ,也 即 显 示 信 息 的 开始 位 置 ; 然后 依次 逐一 显示 字符 信 
息 ; 最 后 进入 无 限 循环 ,实际 上 没有 其 他 工作 要 做 。 

由 于 主 引 导 记 录 长 512 字 节 , 且 以 标记 55H 和 AAH 结尾 ,因此 数据 部 分 也 分 为 两 块 。 
第 一 块 是 填充 块 ,使 得 程序 长 度 达 到 510 字 节 。 在 6.4 节 说 明了 记号 $ 和 记号 $ $ 的 含义 ,也 
说 明了 重复 前 级 times 的 作用 。 第 二 块 是 利用 伪 指 令 安排 的 2 字 节 标 记 。 

值得 说 明 上 述 源 程序 中 指令 “ADD SI. 7C00H” 的 作用 。 在 汇编 时 ,标号 Begin 的 段 内 
偏 移 是 0, 标 号 hello 的 段 内 偏 移 是 其 之 前 代码 数据 的 长 度 ( 字 节 数 )。 但 是 , 当 作 为 主 引 导 记 
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录 被 装载 到 内 存 偏 移 7C00H 处 后 ,标号 Begin 处 的 实际 偏 移 将 是 7C00H ,相应 地 标号 hello 
的 偏 移 也 应 该 加 上 7C00H。 
利用 如 下 命令 ,可 以 把 上 述 源 程序 汇编 生成 512 字 节 的 纯 二 进 制 目标 代码 文件 。 


nasm dhl4asm -fbin -ohello 


利用 辅助 工具 VHDWriter, 可 以 把 纯 二 进 制 目标 代码 文件 hello 写 到 指定 的 虚拟 硬盘 文 
件 。 如 果 指 定 逻 辑 扇 区 号 0, 那 么 就 作为 主 引导 记录 。 

在 完成 这 些 工作 后 ,启动 虚拟 机 ,虚拟 机 的 屏幕 上 显示 信息 “Hello, world”。 当 然 , 这 时 只 
有 强行 关闭 虚拟 机 才 会 结束 。 


7.3.3 直接 写 屏 显 示 方 式 


显示 控制 器 ( 卡 ) 把 显示 器 接 人 系统 ,其 显示 存储 器 用 于 存放 屏幕 上 显示 文本 的 代码 及 其 
属性 或 者 图 像 信 息 。 显 示 存 储 器 作为 系统 存储 器 的 一 部 分 ,可 用 访问 普通 内 存 的 方法 访问 显 
示 存 储 器 。 

如 7.1.2 节 所 述 , 经 典 的 文本 显示 模式 是 25 行 80 列 。 可 以 简单 地 认为 ,在 此 显示 模式 
下 ,屏幕 上 显示 的 字符 代码 及 其 属性 被 依次 保存 在 起 始 地 址 为 B800:0000H 的 显示 存储 区 域 。 
每 一 个 显示 位 置 对 应 显示 存储 区 域 中 的 两 个 字 节 单元 ,这 种 对 应 关系 如 图 7.4 所 示 。 假 设 显 
示 位 置 是 第 行 第 n 列 , 那 么 对 应 的 显示 存储 单元 地 址 的 偏 移 为 (80 x m 十 n) * 2。 







































































B800:0000 | ”ASCI 码 | 一 
0001 属性 空 
0002| ”ASCII 码 ”| 一 
0003 属性 3 
0004 | ”ASCII 码 “| 一 
0005 属性 ey 
0 列 至 79 列 
(0,0) 
[=2 
出 
电 
二 
OF9C ASCII 码 (79,24) 
OF9D 属性 Se 
OF9E ASCII 码 ”| 一 
OF9F 属性 二 











图 7.4 显示 存储 区 域 与 显示 位 置 的 对 应 关系 





为 了 在 屏幕 上 某 个 位 置 显示 字符 ,只 需 把 要 显示 字符 的 代码 及 其 属性 写 到 显示 存储 区 中 
的 对 应 存储 单元 即 可 。 反 之 ,如 果 需 要 获取 屏幕 上 某 个 位 置 显示 的 字符 和 属性 ,那么 只 要 读 取 
显示 存储 区 域 中 的 对 应 存储 单元 。 
【 例 7-11】 如 下 程序 片段 实现 在 屏幕 的 第 3 行 第 9 列 以 黑 底 白字 显示 字符 “A”。 
MW AX Co 





MV Ds, AX ;准备 段 值 

MV BX(80r3r9)* 2 ;对 应 显示 位 置 的 偏 移 
MV AL I'A' 学 符 ASCI 码 

MV A OH ;显示 属性 ( 黑 底 白字 ) 
Ww [EX, MX ;填写 到 显示 存储 区 


所 谓 直接 写 屏 显示 方式 ,是 指 通过 直接 填写 屏幕 位 置 对 应 的 显示 存储 单元 来 实现 显示 的 
方式 。BIOS 的 显示 1/O 程序 采用 直接 写 屏 方式 实现 显示 。 

【 例 7-12】 编写 一 个 程序 ,采用 直接 写 屏 方式 在 屏幕 上 显示 hello 信息 。 

这 个 程序 与 例 7-10 的 程序 dp74 类 似 , 作 为 主 引导 记录 。 不 同 的 是 , 它 采 用 直接 填写 显示 
存储 区 域 的 方式 实现 显示 。 演 示 程 序 dp75. asm 如 下 : 


section text 
bits 16 ;6 位 段 模式 
org 7T000H ;被 装 和 人 到 起 点 为 0000H 的 内 存 区 域 
Begin: 
MV AL 0 ;指定 显示 页 0 
W M5 
INT 10H 指定 显示 页 Ma1 
QD 
WW A Cs 
WW DMX 数据 段 与 代码 段 一 致 
MV Sl, hello 指向 字符 串 首 
MV AX CB800H ;显示 存储 区 段 值 
WwW EX : 送 到 外 
MV DI,(80r5+r8)* 2 ;开始 显示 坐标 : 5 行 8 列 
WW 仙人 名 ;属性 ( 红 底 白字 ) 
Lab1: 
LODSB ; 取 一 个 字符 
RR LA 浏 断 结束 标记 
了 La2 是 , 跳 转 结束 
STOSW ; 填 到 显示 存储 区 
JWP Labl ;继续 
Lab2: 
Over: 
JP er ;进入 无 限 循环 
hello 中 "Helloworld" ,0 


tims 510-($- $$) 中 0 填充 0 直到 满 50 字 节 
中 Sh Wh 最 后 2 字 节 ,共计 5f2 字 节 
从 上 述 程序 可 知 , 它 采 用 了 与 程序 dp74 相同 的 方法 ,保证 汇编 所 得 的 纯 二 进 制 目标 代码 
为 512 字 节 ,并 在 最 后 带 上 特定 的 标记 。 
该 程序 目标 代码 在 作为 主 引导 记录 MBR 后 . 它 会 被 BIOS 装载 到 0000:7C00H 开始 的 内 
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存 区 域 。 为 此 ,上 述 程序 利用 汇编 器 NASM 提供 的 org 指示 , 设 定 起 始 偏 移 为 7C00H。 由 于 
起 始 偏 移 为 7C00H, 那 么 标号 Begin 就 代表 偏 移 7C00H ,标号 hello 代表 的 偏 移 也 就 是 在 
7C00H 的 基础 上 再 加 上 实际 偏 移 值 。 这 样 处 理 后 ,就 不 需要 像 dp74 中 那样 采用 指令 调整 相 
关 地 址 的 偏 移 了 , 见 dp74. asm 源 程 序 “//@1” 行 。 由 此 可 见 ,汇编 器 提供 org 指示 的 用 意 。 

另外 ,上 述 程 序 在 采用 直接 写 屏 方式 显示 字符 串 之 前 ,调用 显示 1/O 程序 指定 了 显示 页 ， 
见 源 程序 “//@1” 行 。 现 对 显示 页 做 些 说 明 。 为 了 支持 屏幕 上 显示 2000 个 字符 ,需要 的 显示 
存储 器 容量 约 为 4KB。 如 果 显示 存储 器 的 容量 为 32KB, 那 么 显示 存储 器 可 存放 8 屏 显 示 内 
容 。 为 此 ,把 显示 存储 器 再 分 成 若干 段 , 称 为 显示 页 。 图 7.4 所 示 的 显示 位 置 与 存储 区 域 的 对 
应 关系 ,适用 于 第 0 显示 页 。 调 用 显示 1/O 程序 的 5 号 功能 ,可 选择 当前 显示 页 。 通 常 , 总 是 
使 用 第 0 显示 页 。 

采取 与 上 节 相 同 的 步骤 ,可 以 把 源 程序 dp75. asm 汇编 成 生成 512 字 节 的 纯 二 进 制 目标 
代码 文件 ,并 存 人 虚拟 硬盘 文件 的 逻辑 扇 区 0, 从 而 作为 主 引导 记录 。 之 后 再 启动 虚拟 机 , 虚 
拟 机 的 屏幕 上 显示 红 底 白字 的 “Hello,world”。 


7.4 一 个 简易 的 加 载 器 


本 节 给 出 一 个 简易 的 加 载 器 ,在 只 有 BIOS 的 环境 中 , 它 能 够 把 工作 (演示 ) 程 序 加 载 到 内 
存 并 运行 。 在 没有 操作 系统 的 虚拟 机 上 ,利用 它 可 以 方便 地 运行 工作 程序 。 


7.4.1 加 载 方法 


加 载 器 的 工作 方式 参照 主 引 导 记 录 MBR 。 

加 载 器 自身 作为 主 引导 记录 MBR。 这 样 ,在 机 器 每 次 启动 时 , 它 会 被 系统 BIOS 读 到 内 
存 , 并 得 到 运行 。 

在 加 载 器 运行 后 , 它 从 硬盘 上 指定 扇 区 读 入 某 个 工作 程序 到 内 存 , 然 后 转 到 该 工作 程序 执 
行 。 这 一 过 程 就 是 加 载 。 

【 例 7-13】 编写 一 个 可 以 作为 主 引导 记录 的 加 载 器 ,由 它 引导 执行 存放 在 硬盘 上 某 个 指 
定 扇 区 的 工作 程序 。 

参照 7. 2. 3 节 介 绍 的 真正 主 引 导 记 录 ,主要 步骤 为 : 首先 将 自身 复制 到 起 始 地 址 为 0060: 
0000H 的 内 存 区 域 ,让 出 所 占用 的 0000:7C00H 开始 的 区 域 ; 然后 发 出 操作 提示 信息 ,并 接收 
用 户 按 键 , 这 样 安排 可 以 使 得 用 户 看 清楚 执行 过 程 ; 随后 从 指定 扇 区 读 入 某 个 工作 程序 ; 最 
后 验证 读 入 的 工作 程序 标记 ,并 转 到 工作 程序 执行 。 

简单 加 载 器 源 程序 dp76. asm 如 下 : 





SDISP EY NOH ;符号 常量 
section text 
bits 16 ;16 位 段 模 式 
Begin: 
MY MC 
WwW SX 
MV Sp, SDISP ;设置 堆栈 
WW 惟信 源 数 据 段 就 是 代码 段 
MV Sl, SDISpr Begin 指向 源 字符 串 首 ( 绝对 地 址 ) 
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PUSH ”WORD O00H 
POP BB ;目标 数据 段 的 段 值 为 000H 
MW Dl,0 ;目标 段 的 偏 移 
QD 学 符 串 操作 方向 
WW x 100H :25%6 个 字 =512 字 节 
RP -MVS ;复制 自身 
PUSH EE ; 压 目 标 段 值 到 堆栈 
PUSH ”Begir2 ; 压 目 标 偏 移 到 堆栈 
RETF 逆 间 转移 到 新 的 位 置 
Begir2: 
PUSH Cs 
PP Ds 数据 段 同 新 的 代码 段 
mov dx, messl 
call PutStr ;显示 操作 提示 信息 
call -GetOhar ;获得 用 户 按键 
MY Sl, DiskwP ;指向 磁盘 地 址 包 DP 
MV DL aH ; 设 虚拟 硬盘 是 C 盘 
WW 用 4 ;采用 扩展 的 读 功 能 
INT 人 ;从 硬盘 读 指 定 的 数据 ( 程 户 到 内 存 
J er ;如 果 读 出 错 , 则 转移 
MV 人 以 0 
WwW EX 
MY 从 OMEH 
QP [ES:SDISP+r OfFEH], AX ;检查 所 读 内 容 是 否 有 标记 /@2 
JZ er ;没有 , 则 转移 
PUSH WFDO ;把 工作 程序 段 值 压 入 堆栈 
PUSH WORD SDISPr 0 ;把 工作 程序 偏 移 压 和 人 堆栈 
RETF ; 转 工作 程序 执行 
Over: 
MV DX, mess2 
CAL Putstr ;显示 出 错 提示 信息 
JP $ ;进入 无 限 循环 
GetChar 获得 用 户 按键 
MV Mo 
INT 1 
FET 


;显示 字符 串 ( 以 0 结尾 ) 
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LODSB ; 取 一 个 字符 
RR LA ;判断 结束 标记 
了 Lab2 是 , 跳 转 结束 
W 仙人 4 
IN 10H ;TY 方式 显示 字符 
JP Labl ;继续 
Lab2: 
FET 
DiswP: 
BB 1 :DIP 尺寸 
DB 0 ;保留 
Wm 1 ; 扇 区 数 
Wm Slsp 缓冲 区 偏 移 
DW on ;缓冲 区 段 值 
D 人 志 起 始 扇 区 LBA 的 低 4 字 节 ( 假设 ) 
mp 0 起 始 扇 区 LA 的 高 4 字 节 
mess1 中 "Pressanykey.....",0 


mess2 中 i * 


times 510-($- $$) 中 0 ;填充 0, 直到 50 字 节 
中 ”5 Qeah :最 后 2 字 节 ,共计 512 字 节 
从 上 述 程序 可 知 ,自身 腾挪 的 方法 与 Windows 7 的 MBR 几乎 相同 。 分别 调 用 BIOS 的 
显示 1/O 程序 和 键盘 I/O 程序 发 出 提示 信息 和 获得 用 户 按键 。 利 用 磁盘 1/O 程序 的 扩展 功 
能 ,从 指定 的 扇 区 读 入 一 个 工作 程序 。 为 了 简化 ,没有 检测 磁盘 1/O 程序 是 否 具备 扩展 功能 ， 
还 通过 伪 指令 直接 定义 了 一 个 磁盘 地 址 包 DAP。 
在 上 述 程序 中 ,采用 了 符号 SDISP 表示 偏 移 7C00H。 请 注意 引用 符号 常量 SDISP 的 指 
今 或 者 语句 ,因为 装载 内 存 区 域 的 起 始 偏 移 是 7C00H, 所 以 需要 据 此 调整 。 但 是 ,在 引用 DAP 
和 提示 信息 的 地 址 偏 移 时 , 却 没 有 调整 ,具体 原因 作为 作业 留 给 读者 思考 。 
利用 以 下 命令 ,可 以 把 上 述 源 程序 汇编 生成 512 字 节 的 纯 二 进 制 目标 代码 文件 。 


nsm dbWasm -fbin -oloader 


利用 辅助 工具 VHDWriter, 可 以 把 纯 二 进 制 目标 代码 文件 loader 写 到 指定 的 虚拟 硬盘 文 
件 的 0 号 扇 区 ,这 样 就 作为 主 引 导 记 录 。 在 虚拟 机 启动 之 前 ,最 好 还 要 把 工作 程序 写 到 虚拟 硬 
盘 文件 的 第 123 号 扇 区 (可 以 调整 源 程序 DAP 中 的 相应 值 ) 。 作 为 示例 ,可 以 直接 把 7. 3. 2 节 
由 dp74. asm 生成 的 hello 作为 工作 程序 ; 也 可 以 把 7. 3. 3 节 由 dp75. asm 生成 的 hello 作为 
工作 程序 。 

显然 ,本 例 给 出 的 加 载 器 实在 是 太 简 单 了 。 它 对 被 加 载 的 工作 程序 有 多 方面 的 限制 : 第 
一 ,工作 程序 只 能 占用 一 个 扇 区 , 且 其 扇 区 逻辑 块 号 固定 ; 第 二 ,工作 程序 的 入 口 点 只 能 在 开 
始 位 置 ; 第 三 ,工作 程序 被 加 载 到 起 始 地 址 为 0000:7C00H 的 内 存 区 域 。 其 实 , 可 以 参考 主 引 
导 记 录 的 方法 ,但 不 应 受 其 束缚 。 


新 概念 汇编 语言 





7.4.2 程序 加 载 器 


1. 加 载 器 的 功能 

为 了 方便 地 在 “ 裸 机 ”上 运行 工作 程序 ,展示 工作 程序 功能 ,需要 一 个 能 够 加 载 普通 工作 程 
序 的 加 载 器 。 

加 载 器 应 该 支持 以 下 功能 : 工作 程序 的 长 度 可 以 超过 一 个 扇 区 ,可 以 存放 在 硬盘 上 的 任 
意 位 置 ,只 要 占用 的 多 个 扇 区 是 连续 的 ; 工作 程序 的 开始 执行 点 可 以 由 程序 员 自行 安排 ; 工 
作 程 序 运行 时 占用 的 内 存 区 域 可 以 较 灵 活 。 这 些 是 对 上 述 dp76. asm 加 载 器 约束 的 突破 。 

一 个 灵活 的 加 载 器 还 应 该 支持 在 被 加 载 工作 程序 运行 结束 后 ,加载 运行 下 一 个 工作 程序 。 

2. 工作 程序 格式 

完全 可 以 设计 与 实现 具有 上 述 功能 的 加 载 器 ,但 需要 工作 程序 的 配合 。 工 作 程 序 应 该 体 
现 开始 执行 点 的 位 置 ,应 该 提出 占用 内 存 区 域 的 起 点 ,必须 反映 自身 的 长 度 。 否 则 ,加 载 器 无 
从 获取 这 些 信息 。 

工作 程序 在 其 头 部 安排 相关 单元 存储 这 些 必 要 的 信息 ,这 里 称 为 特征 信息 。 为 了 尽量 避 
免 误 处 理 , 特 征 信息 中 还 包括 了 签名 信息 ,如 果 签 名 信息 不 准确 ,就 表示 并 非 可 以 执行 的 工作 
程序 。 设 计 如 表 7.7 所 示 的 可 加 载 工作 程序 的 头 部 特征 信息 。 特 殊 信 息 合计 16 个 字 节 。 其 
中 ,签名 信息 规定 为 "YANG" ,格式 版 本 目前 为 1, 最 后 一 个 双 字 保留 为 以 后 使 用 。 


表 7.7 头 部 特征 信息 组 织 结构 





字段 名 称 字 节 数 相对 偏 移 含义 

Signature 4 0 签名 信息 :"YANG" 

Version 2 4 头 部 特征 信息 格式 版 本 号 (目前 为 1) 
Length 2 6 工作 程序 长 度 

Start 2 8 工作 程序 入 口 点 的 偏 移 

Zoneseg 2 10 工作 程序 期 望 内 存 起 始 位 置 的 段 值 
Reserved 4 12 保留 (0) 


每 一 个 准备 被 加 载 的 工作 程序 ,在 其 头 部 都 安排 如 表 7.7 所 示 的 头 部 特征 信息 ,在 特征 信 
息 之 后 ,安排 工作 程序 的 代码 和 数据 。 

3. 加 载 器 的 执行 步骤 

一 个 简易 的 加 载 器 ,可 以 采用 如 下 执行 步骤 。 

(1) 准备 运行 环境 。 它 主要 包括 设置 运行 期 间 所 需要 的 堆栈 。 

(2) 确定 工作 程序 。 提 示 用 户 输入 工作 程序 在 硬盘 上 的 起 始 逻辑 块 号 (LBA) ,假设 工作 
程序 占用 硬盘 上 连续 的 扇 区 ,那么 起 始 LBA 号 就 指定 了 需要 加 载 的 工作 程序 。 

(3) 读 取 指定 工作 程序 的 首 个 扇 区 。 利 用 BIOS 的 磁盘 1/O 程序 ,根据 LBA 号 读 取 工 作 
程序 的 首 个 扇 区 。 把 首 个 扇 区 临时 存放 在 内 存 中 指定 的 缓冲 区 。 在 这 之 后 ,可 以 方便 地 验证 
签名 信息 ,获得 长 度 和 期 望 内 存 区 域 位 置 等 。 

(4) 验证 签名 信息 。 

(5) 获取 工作 程序 的 长 度 。 根 据 长 度 字 节 数 ,可 以 计算 出 工作 程序 占用 的 扇 区 数 。 

(6) 决定 工作 程序 被 加 载 到 内 存 的 起 始 位 置 。 期 望 的 起 始 位 置 由 段 值 来 表示 ,可 以 从 头 
部 的 特征 信息 中 获取 。 但 需要 判断 其 有 效 性 .因为 不 能 完全 由 工作 程序 自己 决定 内 存 起 始 位 
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置 ,否则 会 破坏 加 载 器 自身 ,也 可 能 会 破坏 中 断 向 量 表 等 。 如 果 期 望 的 段 值 在 有 效 范 围 内 , 那 
么 以 它 作为 起 始 位 置 的 段 值 ,否则 采用 默认 的 段 值 。 

(7) 搬移 首 个 扇 区 内 容 。 把 已 经 在 内 存 中 的 首 个 扇 区 的 内 容 复制 到 上 述 指定 的 内 存 区 
域 , 当 然 只 占用 开始 的 512 字 节 。 

(8) 读 取 指定 工作 程序 的 剩余 扇 区 。 从 硬盘 上 把 工作 程序 除 首 个 扇 区 之 外 的 其 他 扇 区 内 
容 , 读 取 到 指定 内 存 随后 的 区 域 。 只 有 工作 程序 超过 一 个 扇 区 , 才 需 要 本 步 。 

(9) 转移 到 工作 程序 执行 。 已 知 工作 程序 的 入 口 点 偏 移 和 段 值 ,转移 到 工作 程序 执行 并 
不 困难 。 如 果 采 用 段 间 调用 的 方式 ,那么 在 工作 程序 运行 结束 后 ,可 以 采用 段 间 返回 的 方式 回 
到 加 载 器 。 

4. 简易 加 载 器 

现在 以 示例 的 形式 给 出 一 个 简易 的 加 载 器 。 

【 例 7-14】 编写 一 个 简易 的 加 载 器 ,在 没有 操作 系统 的 环境 中 , 它 能 够 加 载运 行 符合 指 
定格 式 的 工作 (演示 ) 程 序 。 

一 个 采用 上 述 执 行 步 又 的 简易 加 载 器 dp77. asm 如 下 ,假设 工作 程序 采用 如 表 7. 7 所 示 
的 头 部 特征 信息 。 


Sienature eq 0 ;工作 程序 签名 所 在 位 置 偏 移 
Length equ 6 ;工作 程序 长 度 所 在 位 置 偏 移 
Start equ 8 ;工作 程序 启动 位 置 所 在 偏 移 
ZW eq 1000H ; 缺 省 的 工作 程序 使 用 内 存 区 域 的 段 值 
ZONEHIH eq 9000H ;工作 程序 使 用 的 内 存 区 域 段 值 上 限 
ZEBP eu OEH 首 扇 区 的 缓冲 区 段 值 

section text ; 段 text 

bits 16 ;6 位 段 模式 

org 7000H ;自身 的 起 始 偏 移 
Begin: 

MV Ao0 

al 

MV SSM ;设置 堆栈 Ma1 

MY Sp, OH ;把 堆栈 底 安排 在 0700:0000 

STI 
Lab1: ;循环 加 载 的 起 点 Ma 2 

QD 

PUSH Cs 

POP D ;DS= G, 准备 填写 DP 

WW MAM ZONETBP ;把 临时 内 存 区 域 的 段 值 

MV ”WORD [DiskAP+ 6], AX ;填写 到 MP 中 的 缓冲 区 段 值 字段 

MV EX ;也 保存 到 外 

MV DX mess0 ;提示 输入 的 信息 

CAL Putstr :提示 用 户 输入 工作 程序 起 始 扇 区 LBA 

CAL GetSecAdr ;接收 用 户 的 输入 

mR EAX EX ;如 果 用 户 输入 为 0 则 转 停止 





各 豆 


工 Over 

MY [DiskAPr 8], EAX 
COAL ReadSec 

Jo Lb7 


以 [ES:Start+ 2] 
俯 ZONELOW 


mm 


DWRD [DiswPr 8] 


MV [ES:Start+2], ES 


:填写 到 Dp 中 的 扇 区 LBA 低 4 字 节 字段 
读 工 作 程序 首 扇 区 
; 访 出 错 , 则 转移 


;核查 工作 程序 的 签名 


;签名 不 正确 , 则 转移 
;取得 工作 程序 长 度 
长 度 不 应 该 为 0 

;如 果 为 0 作为 签名 不 正确 处 理 
为 便于 计算 需要 读 取 的 扇 区 数 
;相当 于 除 512, 得 扇 区 数 

;取得 工作 程序 期 望 内 存 段 值 

期 望 的 内 存 区域 必 须 在 规定 范围 内 


;如 果 超 出 范围 , 则 取 下 限 


;设置 DP 中 的 缓冲 区 段 值 
;同时 保存 到 外 
准备 复制 已 经 在 内 存 中 的 首 个 扁 区 


省 扇 区 的 缓冲 区 段 值 
; 源 段 值 


; 改 含 有 工作 程序 的 扇 区 数 


;复制 2 个 双 字 


沁 经 读 取 过 一 个 扇 区 
;如 工作 程序 只 有 一 个 扇 区 , 则 转移 


;调整 缓冲 区 段 值 , 即 内 存 的 下 512 字 节 位 置 
;准备 读 取 下 一 个 扇 区 

; 读 一 个 扇 区 

; 读 出 错 , 则 转移 

;还 有 , 则 继续 


;设置 工作 程序 人 口 点 的 段 值 
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FAR [ES:Start] 


;调用 工作 程序 //@ 3 
;准备 加 载 下 一 个 工作 程序 


Lab7: 


Halt: 


;提示 无 效 工作 程序 
;给 出 提示 信息 
;准备 引导 下 一 个 工作 程序 


;提示 读 磁 盘 出 错 
;给 出 提示 信息 


;结束 提示 
;提示 挂 起 


:陷入 无 限 循 环 


读 一 个 指定 的 扇 区 到 指定 内 存 区 域 


:指向 DR 含 扇 区 LBA 和 缓冲 区 地 址 ) 
;0 盘 

;扩展 方式 读 

读 ! 


接收 用 户 键盘 输入 工作 程序 所 在 扇 区 的 LBA 
;以 指向 缓冲 区 首 

接收 用 户 输入 一 个 数字 串 ( 回 车 结尾 ) 
形成 回 车 换行 效果 


;以 指向 缓冲 区 中 的 数字 串 
;将 数字 串 转换 成 对 应 的 二 进 制 值 ( 至 少 返 回 零 ) 


人 L OH 


人 L OH 


: 取 一 个 数字 符 





IML EX 10 
AD EX EX 
JP ”SHORT .next 

.ok: 
MW EMX EX EM 返回 二 进 制 值 
RET 





PutChar: ;显示 一 个 字符 
W Bo 
W 仙人 4 
INT 10H 
FET 
GetChar: ;键盘 输入 一 个 字符 
W Mo 
INT 1 
RET 
PutStr: ;显示 字符 串 ( 以 0 结尾 ) 
WwW Bo0 
WW Sl, DX 
.Lab1: 
LODSB 
R ALA 
了 .Lab2 
WwW M14 
IN 10H 
JPp .Labl 
.Lab2: 
FET 
DiskAP: ;磁盘 地 址 包 
虽 1H ;DAP 尺寸 
PB 0 ;保留 
W 1 ;局 区 数 
mW 0 ;缓冲 区 偏 移 
mW ZEBP ;缓冲 区 段 值 
D 0 ;起 始 扇 区 号 LA 的 低 4 字 节 
Dm 0 起 始 扇 区 号 LBA 的 高 4 字 节 
buffer: ;缓冲 区 
中 9 ;缓冲 区 的 字符 串 容 量 
中 "18406789" :存放 字符 串 


第 7 章 ”BIOS 和 虚拟 机 Sy 





mess1 中 " Invaild code ..”，OH OH 0 
mess2 中 ”Reading disk error..." , (DH OH 0 
mess3 中 “和 
times 510-($-$$) 中 0 ;填充 0, 直到 50 字 节 
中 sh 0aah 瘟 后 2 字 节 ,共计 52 字 节 
为 了 节省 篇 幅 , 在 上 述 源 程序 中 略 去 了 子 程序 GetDStr 的 代码 ,请 见 7. 1. 3 节 的 dp73. 
asm 所 含 同 名 子 程序 。 


利用 如 下 命令 ,可 以 把 上 述 源 程序 汇编 生成 512 字 节 的 纯 二 进 制 目标 代码 文件 。 


nasm db77 aam -fbin -o loader 


利用 辅助 工具 VHDWriter, 可 以 把 纯 二 进 制 目标 代码 文件 loader 写 到 指定 的 虚拟 硬盘 文 
件 的 0 号 扇 区 ,这 样 在 启动 虚拟 机 后 , 它 就 能 够 多 次 加 载 满足 格式 要 求 的 工作 程序 。 用 户 通过 
输入 工作 程序 在 虚拟 硬盘 上 的 起 始 LBA 号 ,来 指定 需要 运行 的 工作 程序 。 如 果 用 户 输入 0， 
表示 结束 加 载 器 自身 的 运行 。 当 然 ,满足 格式 要 求 的 工作 程序 ,应 该 事先 存放 到 虚拟 硬盘 上 。 
事实 上 ,在 这 样 的 虚拟 机 上 没有 操作 系统 ,也 没有 文件 系统 ,所 以 才 会 比较 麻烦 。 

s. 相关 说 明 

下 面 对 上 述 源 程序 dp77. asm 进行 说 明 。 

(1) 加 载 器 自身 作为 MBR。 由 于 作为 MBR ,因此 保持 512 字 节 ,并 且 以 55H 和 AAH 作 
为 结尾 标记 。 

(2) 调用 方式 运行 工作 程序 。 在 把 工作 程序 的 代码 加 载 到 指定 内 存 区 域 后 ,利用 段 间 调 
用 指令 ,调用 工作 程序 ,参见 源 程序 "//@3? 行 。 采 用 这 种 方式 后 ,工作 程序 运行 结束 时 ,可 以 
返回 到 加 载 器 。 这 样 ,加 载 器 可 以 加 载 其 他 工作 程序 。 

(3) 按 需 安排 内 存 空间 。 只 要 不 超出 规定 的 范围 ,根据 
工作 程序 的 期 望 ,安排 它 所 使 用 的 内 存 区 域 。 加 载 器 使 用 内 
存 的 情况 ,如 图 7.5 所 示 。 可 供 工 作 程序 使 用 的 内 存 区 域 的 
范围 为 10000H 一 A0000H。 事 实 上 ,没有 操作 系统 ,在 管理 
分 配 内 存 时 既 比 较 直 接 ,也 比较 粗放 。 虽 然 避 开 了 BIOS 使 2 2 
用 的 一 些 重要 区 域 ,但 没有 考虑 工作 程序 之 间 的 相互 覆盖 。 _ _ ) 
虽然 一 个 工作 程序 已 经 结束 ,但 其 相关 代码 和 数据 还 可 能 仍 。 ovEo0 | 省 全 和 和 直 
然 保留 在 内 存 中 。 07C00 [加载 器 堆栈 

(4) 安排 一 个 工作 堆栈 。 在 开始 之 初 , 通 过 设置 堆栈 段 
寄存 器 SS 和 堆栈 指针 寄存 器 SP, 设 置 了 加 载 器 的 工作 堆栈 。 
请 参见 源 程 序 “//@1” 行 。 

(5) 每 次 加 载 , 重 新 设置 所 用 到 的 寄存 器 。 每 次 加 载 工 
作 程 序 的 流程 ,从 标号 Labl 处 开始 。 这 样 处 理 , 可 以 形成 一 个 新 的 运行 环境 。 当 然 ,也 许 上 
述 堆栈 也 需要 重新 设置 。 

(6) 注意 段 寄 存 器 DS 和 ES 的 使 用 。 



































00000 


图 7.5 简易 加 载 器 内 存 
使 用 示意 图 
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7.4.3 工作 程序 示例 


现在 来 看 一 个 可 以 作为 示例 的 工作 程序 。 只 要 头 部 含有 表 7. 7 所 描述 的 特征 信息 ,就 满 
足 被 加 载 的 要 求 ,就 可 以 作为 工作 程序 。 

【 例 7-15】〗 编写 一 个 可 以 作为 示例 的 工作 程序 。 

为 了 简化 ,工作 程序 仅 具 有 如 下 功能 : 以 十 六 进 制 数 的 形式 显示 所 在 内 存 区 域 的 段 值 。 

满足 要 求 的 工作 程序 dp78. asm 如 下 : 


section text 
bits 16 
;工作 程序 特征 信息 
Signature 中 " YANG" ;签名 信息 
versim dy 1 ;格式 版 本 
Length dy end of text ;工作 程序 长 度 
Start dy Begin ;工作 程序 入 口 点 的 偏 移 
Zoneseg dy 0088H 江 作 程序 期 望 的 内 存 区 域 起 始 段 值 
Reserved Wd 0 ;保留 
数据 部 分 之 一 
info 中 " Address:" ,0 ;提示 信息 
;代码 部 分 
Begin: ;工作 程序 入 口 
W AC 
WW Ds 以 源 数据 段 与 代码 段 一 致 
QaD ; 清 方向 标志 
WW DX info 
CAL Putstr ;显示 提示 信息 
MW DX Cs ;准备 显示 工作 内 存 区 域 的 段 值 
WwW C4 4 位 十 六 进 制 数 
MV Sl, buffer 闻 符 串 缓冲 区 首 地 址 
Next: 
RL D4 ;循环 左 移 4 位 
WW AL DL 
CAL TOASCN ;转换 成 对 应 ASCII 码 
MV [SD,AL ;依次 填 到 缓冲 区 
IN SI 
LOOP ”Next 于 一 位 
MX DX buffer ;取得 显示 字符 串 首 地 址 
COAL Putstr ;显示 
REF ;返回 到 加 载 程序 !Ma1 
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PutStr: ;显示 字符 串 ( 以 0 结尾 ) 


WW SI 以 :DE 字符 串 起 始 地 址 偏 移 


TOASCI1: ;转换 成 对 应 十 六 进 制 数 的 AN 码 
A OH 准 低 4 位 = 十 六 进 制 数 


tims 104 中 0H ;为 了 演示 ,刻意 插入 了 1024 字 节 
buffer 由 "00000H" ;用 于 存放 工作 内 存 区 域 的 地 址 


end_of_text: ;代码 结束 处 ( 代码 字 节 长 篇 

注意 ,上 述 工作 程序 dp78. asm 的 头 部 特征 信息 。 其 中 ,标号 Begin 代表 了 工作 程序 的 入 
口 点 偏 移 , 它 并 不 在 程序 的 开始 处 。 标 号 end_of_text 是 位 于 源 程序 末尾 的 一 个 标号 ,可 由 它 
获得 工作 程序 的 长 度 。 在 Zoneseg 字段 的 值 0088H 是 期 望 的 内 存 起 始 地 址 的 段 值 ,工作 程序 
可 以 根据 需要 设置 。 从 上 述 加 载 器 的 说 明 可 知 , 这 个 段 值 不 在 规定 的 范围 内 ,如 果 加 载 它 ,分 
配 的 内 存 起 始 地 址 将 会 是 10000H。 

注意 ,上 述 工作 程序 通过 段 间 返回 指令 RETF 结束 运行 ,这 样 它 将 返回 到 加 载 器 。 

为 了 使 得 目标 程序 长 度 超过 512 字 节 ,刻意 插入 了 1024 字 节 的 无 实际 作用 的 数据 。 还 刻 
意 在 代码 的 前 面 和 后 面 .都 安排 了 数据 。 

虽然 它 比较 简单 ,但 利用 它 可 以 观察 加 载 器 如 何 定 位 工作 程序 的 内 存 区 域 。 


习 题 


1. 简要 说 明 BIOS 的 主要 组 成 部 分 。 
2. 简要 描述 应 用 程序 、 操 作 系统 `.BIOS 和 外 设 接口 之 间 的 相互 关系 。 
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3. 编写 一 个 程序 采用 十 六 进 制 数 的 形式 显示 所 按键 的 扫描 码 及 其 对 应 的 ASCII 码 。 当 
连续 两 次 按 回 车 键 时 终止 程序 。 

4. 编写 一 个 程序 在 屏幕 上 循环 显示 26 个 大 写字 母 ,每 行 显示 10 个 , 逐 行 变换 显示 颜色 。 
当 按 下 Shift 键 时 终止 程序 。 

5. 编写 一 个 程序 实现 把 由 用 户 输入 的 十 六 进 制 数 转换 为 十 进 制 数 输出 。 用 户 在 输入 时 
可 以 利用 退 格 键 修正 , 按 回 车 键 表示 输入 结束 。 

6. 编写 一 个 程序 实现 把 由 用 户 输入 的 七 进 制 数 转换 为 八进制 数 输 出 。 

7. 简要 说 明 磁 盘 扇 区 采用 逻辑 块 编 址 方式 的 特点 。 

8. 设 某 品 牌 型 号 的 磁盘 基本 参数 为 : 963 个 柱 面 ,16 个 磁头 ,每 磁道 17 个 扇 区 。 

(1) 该 磁盘 的 总 容量 是 多 少 ? 

(2) 假设 某 个 扇 区 的 CHS 地 址 信息 如 下 : 柱 面 C 一 12, 磁 头 也 一 5, 扇 区 S 一 8, 该 扇 区 的 
LBA 地 址 (逻辑 块 号 ) 是 多 少 ? 

(3) 假设 某 个 扇 区 的 逻辑 块 号 LBA 王 1024, 该 扇 区 的 CHS 地 址 是 多 少 ? 

9. 简要 说 明 主 引导 记录 (MBR) 的 主要 执行 步骤 ,以 安装 Windows 7(32 位 版 本 ) 的 启动 
磁盘 上 的 MBR 为 例 。 

10. 在 7.2.3 节 介绍 的 MBR 中 ,分 别 采 用 RETF 指令 和 JMP 指令 实现 段 间 转移 ,请 比较 
分 析 这 两 种 方法 各 自 的 特点 。 

11. 简要 说 明 程序 代码 自身 腾挪 的 方法 和 注意 事项 。 

12. 说 明 虚 拟 机 和 虚拟 硬盘 文件 的 关系 。 一 台 虚 拟 机 可 以 安装 多 少 个 硬盘 ? 

13. 编写 一 个 可 以 作为 MBR 的 程序 ,其 功能 是 在 屏幕 上 循环 显示 10 个 数字 符 , 在 用 户 按 
回 车 键 后 ,终止 显示 ,并 暂停 CPU。 

14. 有 哪些 方法 可 在 屏幕 的 左上 角 显 示 AB 两 个 字符 ? 请 比较 这 些 方法 。 

15. 编写 一 个 清 屏 程序 。 

16. 编写 一 个 程序 采用 直接 写 屏 显示 方式 在 屏幕 上 循环 显示 26 个 大 写字 母 。 当 按 任 一 
键 后 终止 程序 ,通过 调用 BIOS 键盘 管理 模块 的 1 号 功能 判别 是 否 有 键 按 下 。 

17. 编写 一 个 程序 把 (控制 台 ) 屏 幕 上 显示 的 全 部 大 写字 母 变换 为 对 应 小 写字 母 。 

18. 编写 一 个 程序 统计 当前 (控制 台 ) 屏 幕 上 显示 的 字母 个 数 。 

19. 编写 一 个 程序 判别 当前 (控制 台 ) 屏 幕 上 是 否 存在 字符 串 “AB”。 在 屏幕 的 底 行 显 示 
提示 信息 , 按 任意 键 后 终止 程序 。 

20. 简要 说 明 工 作 程序 头 部 特征 信息 的 作用 ,并 说 明 COM 类 型 程序 与 EXE 类 型 程序 的 
差异 。 

21. 简要 说 明 本 章 所 述 程序 加 载 器 的 功能 和 特点 (限制 因素 ) 。 

22. 简要 说 明 本 章 所 述 程序 加 载 器 的 执行 步骤 。 

23. 编写 一 个 工作 程序 ,其 功能 是 显示 HELLO 信息 。 

24. 编写 一 个 工作 程序 ,其 功能 是 确定 各 种 显示 属性 值 对 应 的 显示 效果 。 

25. 改写 习题 3.4.5 和 6 的 程序 ,使 它们 分 别 成 为 工作 程序 。 

26. 编写 一 个 工作 程序 ,其 功能 是 以 十 六 进 制 数 的 形式 显示 输出 C 盘 上 逻辑 块 号 LBA 为 
1056 扇 区 的 内 容 。 请 采用 磁盘 1/O 程序 的 扩展 功能 读 取 磁盘 指定 扇 区 的 内 容 。 建 议 在 虚拟 
机 上 对 虚拟 磁盘 文件 进行 操作 ,并 利用 VHDWriter 工具 , 先 把 相关 数据 写 到 指定 的 扇 区 。 

27. 编写 一 个 工作 程序 ,其 功能 是 把 C 盘 上 逻辑 块 号 LBA 为 1888 扇 区 开始 的 3 个 扇 区 
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复制 到 逻辑 块 号 LBA 为 2345 开始 的 扇 区 。 请 采用 磁盘 1/O 程序 的 扩展 功能 读 写 磁盘 。 建 议 
在 虚拟 机 上 对 虚拟 磁盘 文件 进行 操作 。 

28. Windows 平台 上 ,应 用 程序 能 够 直接 访问 计算 机 系统 的 硬件 资源 吗 ? 应 用 程序 能 够 
直接 调用 BIOS 进行 输入 或 输出 吗 ? 控制 台 环境 中 运行 的 应 用 程序 调用 BIOS 实现 输入 或 输 
出 ,请 解释 之 。 

29. 谈 谈 使 用 虚拟 机 Bochs 和 VirtualBox 的 体会 。 





输入 输出 和 中 断 


只 有 具备 了 输入 和 输出 功能 ,系统 才 完 备 。 只 有 介绍 了 输入 和 输出 操作 ,汇编 语言 课程 才 
完整 。 本 章 首 先 介绍 输入 和 输出 的 基本 概念 ,然后 介绍 查询 传送 方式 ,最 后 概述 中 断 并 举例 说 
明 中 断 处 理 程序 的 设计 。 

本 章 所 说 的 输入 和 输出 是 站 在 处 理 器 或 主机 立场 上 而 言 的 ,也 即 输入 是 指 输入 到 处 理 器 
或 主机 ,输出 是 指 从 处 理 器 或 主机 输出 。 

为 了 简化 ,仍然 以 早期 的 PC 及 其 兼容 机 为 背景 。 事实 上 ,现在 的 PC 兼容 了 早先 的 PC， 
现在 的 配套 控制 芯片 集成 了 早先 的 配套 控制 芯片 。 

本 章 演 示 程 序 的 源 代 码 都 采用 7.4 节 中 介绍 的 可 加 载 格式 ,在 把 由 汇编 器 NASM 生成 的 
纯 二 进 制 目标 代码 写 到 虚拟 硬盘 文件 后 ,可 以 在 虚拟 机 上 运行 。 


8.1 输入 输出 的 基本 概念 


本 节 说 明 1/O 端口 地 址 和 数据 传送 方式 等 基本 概念 ,介绍 [LO 指令 ,并 以 存 取 RTC/ 
CMOS RAM 来 演示 输入 和 输出 。 


8.1.1 I/O 端口 地 址 


在 计算 机 系统 中 ,每 种 输入 或 输出 设备 都 要 通过 一 个 硬件 接口 或 控制 器 和 CPU 相连 。 
例如 ,键盘 和 鼠标 通过 USB 接口 与 系统 相连 ; 硬盘 通过 硬盘 接口 与 系统 相连 。 图 8. 1 是 处 理 
器 与 部 分 外 部 设备 的 连接 示意 图 。 

逻辑 上 接口 是 完成 输入 或 输出 的 桥梁 ,物理 上 接口 是 实现 输入 或 输出 转换 控制 的 电路 。 
从 程序 设计 的 角度 看 ,接口 由 一 组 寄存 器 (或 存储 单元 ) 组 成 。 利 用 1/O 指令 ,程序 存 取 接口 
中 的 寄存 器 ,获得 外 部 设备 的 状态 信息 ,操纵 控制 外 部 设备 的 动作 ,从 而 实现 数据 的 输入 或 
输出 。 











键盘 /鼠标 等 
USB 接口 | ( USB 设 备 ) 


RTC 接 口 
















处 理 器 








硬盘 接口 硬盘 


图 8.1 处 理 器 与 部 分 外 部 设备 的 连接 示意 图 
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为 了 存 取 接口 中 的 寄存 器 ,计算 机 系统 会 给 这 些 寄存 器 安排 对 应 的 存 取 地 址 ,这 样 的 地 址 
被 称 为 I/O 端口 地 址 。 可 以 认为 ,I/O 端口 就 是 用 于 输入 或 输出 的 接口 ,端口 地 址 就 是 端口 的 
编号 ,根据 端口 地 址 可 以 访问 端口 或 者 说 存 取 接口 中 的 寄存 器 。 

1/O 端口 地 址 可 以 与 存储 单元 地 址 互相 独立 ,也 可 以 统一 编 址 。 

在 采用 IA-32 系列 CPU 的 计算 机 系统 中 ,1/O 端口 地 址 和 存储 单元 的 地 址 是 各 自 独立 
的 ,分 占 两 个 不 同 的 地 址 空间 。IA-32 系列 CPU 提供 16 位 的 IVO 端口 地 址 ,因而 理论 上 系统 
可 安排 64KB 个 8 位 端口 ,或 可 安排 32KB 个 16 位 端口 。 但 实际 上 ,PC 及 其 兼容 机 一 般 只 使 
用 0 一 3FFH 内 的 1/O 端口 地 址 ,只 占 整个 1/0 端口 地 址 空间 的 很 小 一 部 分 。 


8.1.2 I/O 指令 


由 于 IA-32 系列 CPU 的 1/O 端口 地 址 和 内 存单 元 地 址 是 独立 的 ,因此 需要 采用 专门 的 
1/O 指令 来 存 取 接 口上 的 寄存 器 ,也 就 是 说 要 用 专门 的 1/O 指令 进行 输入 和 输出 。 
1. 输入 指令 
输入 指令 的 一 般 格式 如 下 : 
IN 累加 器 ,端口 地 址 
输入 指令 从 一 个 输入 端口 读 取 一 个 字 节 、 一 个 字 或 一 个 双 字 , 传 送 至 累加 器 AL、AX 或 
EAX。 端 口 地 址 可 采用 直接 方式 表示 ,也 可 采用 间接 方式 表示 。 当 采用 直接 方式 表示 端口 地 
址 时 ,端口 地 址 仅 为 8 位 , 即 0 一 OFFH; 当 采 用 间接 方式 表示 端口 地 址 时 ,端口 地 址 存放 在 
DX 寄存 器 中 ,端口 地 址 可 为 16 位 。 
【 例 8-1】 如 下 两 条 输入 指令 都 采用 直接 方式 表示 端口 地 址 : 
IN AL,2IH ;从 端口 2H 取 一 个 字 节 到 AL 
IN AL,7IH ;从 端口 TH 取 一 个 字 节 到 AL 
当 端 口 地 址 超过 OFFH 时 ,只 能 利用 寄存 器 DX 间接 端口 寻 址 。 
【 例 8-2〗 如 下 指令 片段 实现 从 地 址 为 1FOH 的 端口 读 取 一 个 字 节 到 累加 器 AL: 
MY DX 1FH 
IN AL 以 
当 从 端口 输入 一 个 字 时 ,相当 于 同时 从 端口 n 和 十 1 分 别 读 取 一 个 字 节 。 
【 例 8-3】〗 如 下 指令 片段 实现 从 地 址 为 1FOH 的 端口 读 取 一 个 字 到 累加 器 AX: 
WwW DX 1FH 
IN A Dx 
上 述 两 条 指令 连续 执行 ,相当 于 从 端口 1FOH 输入 一 个 字 节 送 寄 存 器 AL, 从 1F1H 输入 
一 个 字 节 送 寄存 器 AH。 
2. 输出 指令 
输出 指令 的 一 般 格式 如 下 : 
QUr 端口 地 址 , 累加 器 
输出 指令 将 AL 中 的 一 个 字 节 ,或 在 AX 中 的 一 个 字 ,或 EAX 中 的 一 个 双 字 输出 到 指定 
端口 。 像 输入 指令 一 样 ,端口 地 址 可 采用 直接 方式 表示 ,也 可 采用 间接 方式 表示 。 当 采用 直接 
方式 表示 端口 地 址 时 ,端口 地 址 仅 为 8 位 : 即 0~OFFH; 当 采 用 间接 方式 表示 端口 地 址 时 , 端 
口 地 址 存放 在 DX 寄存 器 中 ,端口 地 址 可 为 16 位 。 
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【 例 8-4】 如 下 指令 片段 把 值 20H 分 别 输出 到 地 址 为 21H 和 0A1H 的 两 个 端口 : 


OT OMH A 
【 例 8-5】 如 下 指令 片段 把 数据 3235H 输出 到 地 址 为 1FOH 的 端口 : 
MV AX, 3235H 


MV DX 0IFOH 
QO DM 


8.1.3 数据 传送 方式 


这 里 的 数据 传送 是 指 CPU 与 外 部 设备 之 间 的 数据 传送 。 

1. CPU 与 外 设 之 间 交 换 的 信息 

CPU 与 外 设 之 间 交 换 的 信息 包括 数据 、 控 制 信息 和 状态 信息 。 尽 管 这 3 种 信息 具有 不 同 
性 质 , 但 它们 都 通过 IN 和 OUT 指令 在 数据 总 线 上 进行 传送 ,所 以 通常 采用 分 配 不 同 端口 的 
方法 将 它们 加 以 区 别 。 

数据 是 CPU 和 外 设 真正 要 交换 的 信息 。 数 据 通常 为 8 位 或 16 位 ,甚至 可 以 是 32 位 ,可 
分 为 各 种 不 同类 型 。 不 同 的 外 设 要 传送 的 数据 类 型 也 是 不 同 的 。 

控制 信息 输出 到 1/O 接口 ,告诉 接口 和 设备 要 做 什么 工作 。 

从 接口 输入 的 状态 信息 表示 1/O 设备 当前 的 状态 。 在 输入 数据 前 ,通常 要 先 取 得 表示 设 
备 是 否 已 准备 好 的 状态 信息 ; 在 输出 数据 前 ,往往 要 先 取得 表示 设备 是 否 忙碌 的 状态 信息 。 

2. 数据 传送 方式 

计算 机 系统 中 CPU 与 外 部 设备 之 间 传 送 数据 的 方式 主要 分 为 以 下 四 类 。 

(1) 无 条 件 传送 方式 。 在 不 需要 查询 外 设 的 状态 , 即 已 知 外 设 已 准备 好 或 不 忙碌 时 ,可 以 
直接 使 用 IN 或 OUT 指令 实现 数据 传送 。 这 种 方式 软件 实现 简单 ,只 要 在 指令 中 指明 端口 地 
址 ,就 可 选 通 指定 外 设 进行 输入 或 输出 。 

无 条 件 传 送 方式 是 方便 的 ,但 要 求 外 设 工作 速度 能 与 CPU 同步 ,否则 就 可 能 出 错 。 例 
如 ,在 外 设 还 没有 准备 好 的 情况 下 ,就 用 IN 指令 取得 的 数据 可 能 是 不 正确 的 数据 。 

(2) 查询 方式 。 查 询 传送 方式 适用 于 CPU 与 外 设 不 同步 的 情况 。 在 输入 之 前 ,查询 外 设 
数据 是 否 已 准备 好 , 若 数据 已 准备 好 , 则 输入 ; 否则 继续 查询 ,直到 数据 准备 好 。 在 输出 之 前 ， 
查询 外 设 是 否 “ 忙 碌 ”, 若 不 “忙碌 ”, 则 输出 ; 否则 继续 查询 ,直到 不 “忙碌 ”。 也 就 是 说 ,要 等 待 
到 外 设 准 备 好 时 才能 输入 或 输出 数据 ,而 通常 外 设 速度 远 远 慢 于 CPU 速度 ,所 以 查询 过 程 将 
花费 大 量 的 时 间 。 

(3) 中 断 方式 。 为 了 提高 CPU 的 效率 ,可 采用 中 断 方式 。 当 外 设 准 备 好 时 ,外 设 向 CPU 
发 出 中 断 请 求 ,CPU 转 入 中断 处 理 程序 ,完成 输入 或 输出 工作 。 

(4) 直接 存储 器 传送 (DMA) 方 式 。 由 于 高 速 IO 设备 (如 磁盘 驱动 器 等 ) 准 备 数据 的 时 
间 短 ,要求 传送 速度 快 等 特点 ,所 以 一 般 采 用 直接 存储 器 传送 方式 , 即 高 速 设备 与 内 存储 器 直 
接 交 换 数据 。 这 种 方式 传送 数据 是 成 组 进行 的 。 其 过 程 是 : 先 把 数据 在 高 速 外 设 中 存放 的 起 
始 位 置 .数据 在 内 存储 器 中 存放 的 起 始 地 址 、 传 送 数据 长 度 等 参数 输出 到 连接 高 速 外 设 的 接口 
(控制 器 ); 然后 启动 高 速 外 设 ,设备 准备 开始 直接 传送 数据 。 当 高 速 外 设 直接 传送 准备 好 后 ， 
向 处 理 器 发 送 一 个 直接 传送 的 请 求 信号 ,处 理 器 以 最 短 时 间 批 准 进行 直接 传送 ,并 让 出 总 线 控 
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制 权 , 高 速 外 设 在 其 控制 器 控制 下 交换 数据 。 数 据 交 换 完毕 后 ,由 高 速 外 设 发 出 “完成 中 断 请 
求 ”, 并 交 回 总 线 控制 权 。 处 理 器 响应 上 述 中 断 , 由 对 应 的 中 断 处 理 程序 对 高 速 外 设 进行 控制 
或 对 已 经 传送 的 数据 进行 处 理 , 中 断 返 回 后 , 原 程序 继续 运行 。 


8.1.4 实时 时 钟 的 存 取 


现在 以 存 取 PC 及 其 兼容 机 中 的 实时 时 钟 为 例 , 简 单 说 明 输 入 和 输出 。 

1. 关于 RTC/CMOS RAM 

在 早先 的 PC 及 其 兼容 机 上 有 一 个 RTC/COMS RAM 芯片 , 它 由 计时 电路 和 互补 金属 氧 
化 物 半导体 随机 存 取 存储 器 组 成 。 它 不 仅 提 供 包 括 年 ,月 、 日 和 时 、 分 、 秒 在 内 的 实时 时 钟 
(Real-Time Clock) 信 息 ,而 且 还 可 长 期 保存 系统 配置 信息 。 现 在 该 芯片 的 功能 被 集成 到 输入 
和 输出 控制 集中 器 (ICH) 芯 片 内 了 ,但 其 操作 控制 方式 和 端口 地 址 都 没有 变化 。 

RTC/CMOS RAM 作为 一 个 1/O 接口 ,系统 分 配 的 1/O 端口 地 址 区 为 70H 一 7FH ,通过 
IN 和 OUT 指令 可 对 其 进行 存 取 。 现 在 该 RTC/CMOS RAM 能 够 提供 128 个 字 节 单元 ,其 
中 用 于 记录 日 期 和 时 钟 信息 的 单元 只 占 少量 ,分 配 情况 如 表 8. 1 所 示 , 其 他 大 量 单元 用 于 记录 
系统 配置 信息 和 其 他 信息 。 后 面 将 介绍 寄存 器 A 一 D 内 容 的 作用 。 


表 8.1 RTC/CMOS RAM 的 时 间 信息 布局 





内 部 地 址 内 容 内 部 地 址 内 容 
00H 秒 07H 日 
01H 报警 秒 08H 月 
02H 分 09H 年 
03H 报警 分 0AH 寄存 器 A 
04H 时 0BH 寄存 器 B 
05H 报警 时 oCH 寄存 器 C 


06H 星期 0DH 寄存 器 D 





2. RTC/CMOS RAM 的 存 取 

在 存 取 RTC/CMOS RAM 芯片 的 字 节 存 储 单元 时 ,需要 分 两 步 进 行 。 首 先 把 要 存 取 单 
元 的 内 部 地 址 送 到 端口 70H ,然后 接着 存 取 端口 71H。 这 里 70H 是 其 索引 端口 ,71H 是 其 数 
据 端口 。 采 用 这 种 索引 端口 和 数据 端口 的 方式 ,可 以 实现 通过 少量 端口 地 址 来 存 取 接 口上 的 


大 量 寄存 器 。 
【 例 8-6】 读 取 CMOS RAM 的 08H 单元 的 代码 片段 如 下 : 
MW A8 ;要 访问 单元 的 内 部 地 址 
Or MHA ;把 地 址 送 到 索引 端口 
IN AL 7IH ;从 数据 端口 取得 相应 单元 的 内 容 
【 例 8-7】 把 16H 写 到 CMOS RAM 的 09H 单元 的 代码 片段 如 下 : 
MW A9 ;要 访问 单元 的 内 部 地 址 
QO HA ;把 地 址 送 到 索引 端口 
MW A 1 ;要 输出 数据 19 
QT 7IH 人 :把 数据 从 数据 端口 输出 


【 例 8-8】 编写 一 个 显示 当前 时 间 的 程序 。 
如 上 所 述 , 只 要 读 取 CMOS RAM 的 相应 单元 ,就 可 以 获取 当前 的 时 间 。 需 要 说 明 的 是 ， 
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在 CMOS RAM 的 相应 单元 中 存储 的 日 期 和 时 间 值 采用 BCD 码 格式 。 演 示 程 序 首先 取得 时 
间 值 ; 然后 把 BCD 码 转 换 成 ASCII 码 ,并 显示 。 为 了 反映 实时 变化 ,在 每 次 显示 当前 时 间 后 ， 
就 等 待 用 户 按键 , 当 用 户 按 回 车 键 则 结束 ,和 否则 再 次 显示 当前 时 间 。 演 示 程 序 dp81. asm 
如 下 : 

;功能 显示 当前 时 间 ( 采用 虚拟 机 可 加 载 格式 ) 


section text 
bits 16 
;可 加 载 格式 的 头 部 
Signature db "YANG" ;签名 信息 
Version dn 1 ;格式 版 本 
Length dn end_of text ;工作 程序 长 度 
Start dn Begin ;工作 程序 入 口 点 的 偏 移 
dy 1300H ;工作 程序 入 口 点 的 段 值 
Reserved dd 0 ;保留 
Begin: 
PUSHCS 
POP DS 数据 段 与 代码 段 相同 
NEXT: 
MV AL, 2 ;分 单元 地 址 
OUT TH 作 ;准备 读 取 分 单元 
IN AL 7IH ; 读 分 值 BD 码 
MX [minute], AL ;保存 之 
MV AL 0 ; 秒 单元 地 址 
OUT TH 作 ;准备 读 取 秒 单元 
IN AL 7IH ; 读 秒 值 BD 码 
MV [second], AL ;保存 之 
MN AL [minute] 
CALLEchoBD ;显示 时 钟 的 分 值 
WA ':' 
CALLPutChar ;显示 间隔 符 
CALLEchoBCD ;显示 时 钟 的 秒 值 
MN AL OH 形 成 回 车 换行 效果 
CALLPutChar 
MO AL OH 
CALLPutChar 
MV AL 0 ;等 待 并 接收 用 户 按键 
INT 16H 
QP AL OH ;如 果 按 回 车 键 ,结束 


JZ BT ;否则 ,再 次 显示 当前 时 间 


FRETF :结束 ( 返回 到 加 载 器 ) 
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EchoBCD: ;显示 两 位 BD 码 
PUSHAX 
SRAL 4 ;把 高 位 BD 码 转 成 AN 码 
AD AL '0' 
CALLPutChar ;显示 之 
POP A 
AD AL OH ;把 低位 BD 码 转 成 AN 码 
AD AL '0' 
CALLPutChar ;显示 之 
FET 
PutChar: ;TY 方式 显示 一 个 字符 
MX BH 0 
MX AH 14 
INT 10H 
FET 
secnd DB 0 ; 秒 BD 码 保存 单元 
minute DB 0 ;分 BD 码 保存 单元 
end_of_text: ;结束 位 置 


为 了 节省 篇 幅 , 上 述 演示 程序 dp81. asm 每 次 仅仅 显示 当前 时 间 的 分 和 秒 部 分 。 另 外 ,在 
读 取 时 间 值 时 ,还 留 有 瑕 症 , 参 见 8. 2. 2 节 的 说 明 。 


8.2 查询 传送 方式 


本 节 在 给 出 查询 方式 的 基本 流程 后 ,结合 实时 时 钟 的 设置 ,说 明 采 用 查询 传送 方式 实现 输 
入 和 输出 。 


8.2.1 查询 传送 流程 


查询 方式 的 基本 思想 是 由 CPU 主动 地 查询 指定 外 部 设备 的 当前 状态 , 若 设备 就 绪 , 则 立 
即 与 设备 进行 数据 交换 ,否则 循环 查询 。 具 体 地 说 ,在 输入 之 前 ,要 查询 外 设 的 数据 是 否 已 准 
备 好 ,直到 外 设 把 数据 准备 好 后 才 输 入 ; 在 输出 之 前 ,要 查询 外 设 是 否 “ 忙 碌 ”, 直 到 外 设 不 “ 忙 
碌 ” 后 才 输 出 。 查 询 传送 方式 适用 于 CPU 与 外 设 不 同步 的 情况 。 查 询 方式 输入 和 输出 的 流 
程 示 意图 如 图 8. 2 所 示 。 

为 了 采用 查询 方式 输入 或 输出 ,连接 外 设 的 相应 接口 不 仅 要 有 数据 寄存 器 ,而 且 还 要 有 状 
态 寄 存 器 ,有 些 还 要 有 控制 寄存 器 。 数 据 寄 存 器 用 来 存放 要 传送 的 数据 ,状态 寄存 器 用 来 存放 
反映 设备 当前 状态 的 信息 。 通 常 ,在 状态 寄存 器 中 有 一 个 “就 绪 (Ready)” 位 或 一 个 “忙碌 
(Busy)” 位 来 反映 外 设 是 否 已 准备 好 。 

在 实际 应 用 中 ,为 防止 设备 因 某 种 原因 发 生 故 障 而 无 法 就 绪 或 空闲, 从 而 导致 CPU 陷入 
无 限 循环 之 中 ,通常 都 设计 一 个 等 待 超时 值 , 其 值 随 设备 而 定 。 一 旦 设备 在 规定 时 间 内 还 无 法 
就 绪 或 空闲, 则 中 止 循环 查询 过 程 。 因 此 ,图 8. 2 所 示 的 流程 图 修改 为 图 8. 3 所 示 的 一 般 查询 
方式 流程 图 。 大 多 数 情况 下 ,等 待 超 时 值 用 查询 次 数 表 示 ,每 查询 一 次 ,查询 次 数 减 1, 如 果 查 
询 次 数 减 到 0, 那么 查询 等 待 也 就 结束 。 
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准备 查询 次 数 
取 设备 状态 信息 
开始 
~ 已 准备 好 吗 ? 
取 设备 状态 信息 调整 查询 次 数 y 
输入 或 给 出 数据 
已 准备 好 吗 ? 香 询 次 数 满 吗 ? J 
IY Y 置 正常 标志 
输入 或 输出 数据 置 异常 标志 
FE 
结束 结束 
图 8.2 查询 方式 输入 和 输出 的 流程 示意 图 图 8.3 一 般 查 询 方式 流程 图 


有 时 系统 中 同时 有 几 个 设备 要 求 输入 或 输出 数据 ,那么 对 每 个 设备 都 可 编写 一 段 执行 输 
入 或 输出 数据 的 程序 ,然后 轮流 查询 这 些 设备 (接口 ) 的 状态 寄存 器 中 的 就 绪 位 , 当 某 一 设备 准 
备 好 允许 输入 或 输出 数据 时 ,就 调用 这 个 设备 的 1/O 程序 完成 数据 传送 ,否则 依次 查询 下 一 
设备 是 否 准 备 好 。 

查询 方式 的 优点 是 : 软 硬 件 实现 比较 简单 ; 当 同 时 查询 多 个 外 设 时 ,可 以 由 程序 安排 查 
询 的 先后 次 序 。 缺 点 是 浪费 了 CPU 原本 可 执行 大 量 指令 的 时 间 。 


8.2.2 实时 时 钟 的 稳妥 存 取 


在 8.1.4 节 介绍 了 实时 时 钟 (RTC) 及 其 存 取 方 法 ,并 由 程序 dp81. asm 演示 读 取 RTC 的 
时 间 。 其 实 ,只 有 在 RTC 空闲 时 读 取 其 时 间 值 才 是 稳妥 的 方式 。RTC 会 自动 更 新 时 间 值 ,在 
更 新 期 间 RTC 属于 忙碌 ,此 时 不 宜 存 取 RTC 的 时 间 值 。 
可 以 认为 ,如 表 8. 1 所 示 的 位 于 内 部 地 址 0AH 的 寄存 器 A 是 一 个 状态 寄存 器 。 寄 存 器 
A 的 位 7 是 计时 更 新 标志 位 : 为 1 表示 RTC 正在 计时 ; 为 0 表示 短 时 间 内 不 会 更 新 ,RTC 暂 
时 空闲 。 因 此 ,在 存储 或 者 获取 RTC 的 时 间 值 之 前 ,可 以 而 且 应 该 通过 判别 该 标志 位 ,查询 
其 是 否 空闲 。 
【 例 8-9】 编写 一 个 设置 RTC 时 间 值 的 子 程序 ,采用 查询 方式 实现 数据 的 传送 。 
假设 通过 寄存 器 传递 作为 时 间 值 的 参数 ,而 且 时 、 分 、 秒 的 值 采 用 BCD 码 格 式 。 子 程序 
as82. asm 如 下 : 
六 程序 名 ( 和 人口 标号 : set_timel 
;功能 : 设置 Re 时 间 值 (采用 BD 码 表示 ) 
;入口 参数 :QF 小 时 值 ; Q= 分 值 ; o 秒 值 
Set_time1: 
UIP: 
MO AL 10 ;寄存 器 A 地 址 ( OH) 
OTHA ;准备 读 取 寄存 器 A 
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IN AL 7IH ; 读 取 寄存 器 A 

TESTAL gH 测试 是 否 正在 更 新 

JNZ UIP ;正在 更 新 中 , 则 继续 测试 
Set_TV: 

MX AL 0 ; 秒 单元 地 址 

OUT 7H 作 ;准备 设置 秒 单元 

MX AL DH 

OUT 7IH AL ;设置 秒 值 

MM AL 2 ;分 单元 地 址 

OUT 7H A ;准备 设置 分 单元 

MO AL a 

OUT 7IH A ;设置 分 值 

MV AL 4 ;时 单元 地 址 

OUT 7H 作 ;准备 设置 时 单元 

MX AL OH 

OUT 7IH AL ;设置 时 值 

FET 


从 上 述 子 程序 as82. asm 可 见 , 在 设置 RTC 的 时 间 值 之 前 ,采用 了 查询 方式 判断 RTC 是 
否 处 于 空闲 状态 。 具 体 实现 过 程 采 用 了 图 8. 2 的 流程 。 但 是 ,这 样 处 理 仍 然 不 够 稳妥 ,因为 如 
果 RTC 出 现 故障 ,始终 不 能 回 到 空闲 状态 ,那么 就 会 陷入 无 休止 查询 的 泥潭 。 

【 例 8-10】 完善 例 8-9 的 子 程序 ,安排 查询 次 数 上 限 。 

采用 图 8. 3 所 示 的 一 般 查询 方式 流程 ,为 此 安排 出 口 参数 。 完 善后 的 子 程序 as83. asm 
如 下 : 

; 子 程序 名 ( 入 口 标号 ) : set_time2 

功能 : 设置 RC 时 间 值 ( 采用 BD 码 表示 ) 

;人 口 参 数 :QF 小 时 值 ; Q= 分 值 ; ot 秒 值 

出口 参数 :0=0, 设 置 成 功 ; = 1, 设 置 失败 


set_time2: 
PUSH & 
MY  & 200 ;安排 查询 次 数 
UIP: 
W AL 10 
QT MA 
IN A 7IH ; 读 取 寄存 器 A 
TEST AL eH 测试 是 否 正在 更 新 
LOOPNZ_UIP 正在 更 新 且 查询 次 数 未 满 , 则 继续 查询 
PP & 
STC ;准备 出 口 参数 ( 先 假设 失败 ) 
JZ .Qer ;确实 失败 , 则 转 
OL Set WV ;具体 设置 时 间 值 
ac ;准备 出 口 参 数 
.Over: 
RET 


为 了 节省 篇 幅 , 把 子 程序 as82. asm 中 从 标号 Set_TV 开始 的 具体 设置 RTC 时 间 值 的 代 
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码 片段 改写 成 另 一 个 子 程序 Set_TV。 


8.3 中 断 概述 


如 果 没 有 中 断 , 计 算 机 系统 将 会 怎样 ? 很 难 设想 。 本 节 结 合 PC 简要 介绍 中 断 的 相关 概 
念 ,说 明 实 方式 下 系统 响应 中 断 的 过 程 。 


8.3.1 中 断 的 概念 


1. 中 断 和 中 上 断 源 

中 断 是 一 种 使 CPU 挂 起 正在 执行 的 程序 而 转 去 处 理 特殊 事件 的 操作 。 换 名 话说, 中断 
指 暂停 执行 当前 程序 ,切换 执行 处 理 特殊 事件 的 服务 程序 。 把 这 样 的 处 理 特殊 事件 的 服务 程 
序 称 为 中 断 处 理 程序 , 它 就 是 响应 处 理 中 断 的 程序 。 

各 种 引起 中 断 的 事件 被 称 为 中 断 源 。 它 们 可 能 是 来 自 外 设 的 输入 或 输出 请 求 。 例 如 ,由 
按键 引起 的 键盘 中 断 , 由 串 行 口 接收 到 信息 引起 的 串 行 口中 断 等 ; 也 可 能 是 来 自 CPU 内 部 的 
一 些 异常 事件 ,如 在 执行 除法 指令 时 除数 为 0。 

计算 机 系统 中 有 各 种 各 样 的 事件 会 引起 中 断 ,也 即 存在 多 种 不 同 的 中 断 源 。 每 种 类 型 的 
中 断 都 分 别 由 对 应 的 中 断 处 理 程序 来 处 理 。 

“中 断 "作为 动词 , 指 打 断 正在 执行 的 当前 程序 。“ 中 断 "作为 名 词 , 指 一 系列 相关 操作 过 
程 。 图 8.4 给 出 了 中 断 及 其 处 理 过 程 的 示意 图 。 当 有 中 断 请 求 ,并 响应 中 断 时 ,CPU 暂停 执 
行当 前 程序 ,切换 执行 对 应 的 中 断 处 理 程序 。 在 执行 完毕 中 断 处 理 程序 时 ,返回 到 被 中 断 的 当 
前 程序 继续 执行 。 发 生 中 断 的 位 置 , 被 称 为 断 点 。 

从 图 8.4 可 知 , 中 断 及 其 处 理 的 过 程 类 似 于 主 程序 调 当前 程序 
用 子 程序 ,实际 上 它们 之 间 具 有 本 质 区 别 。 主 程序 与 子 程 。 ,类 4 中央 
序 必定 有 联系 ,存在 从 属 关系 。 但 是 ,当前 程序 与 中 断 处 理 。 WR | Rn 仆 和 
程序 (服务 程序 ) 一 般 没有 联系 ,不 存在 从 属 关系 。 试 想 ,用 we i 
户 随时 可 能 项 键盘 ,因此 随时 可 能 发 生 键盘 中 断 , 当前 程序 i | [~ 
随时 可 能 被 用 户 敲 键盘 的 事件 而 中 断 , 然 而 一 般 来 说 当前 、 
程序 与 键盘 中 断 处 理 程序 之 间 不 会 有 直接 联系 。 `、 

2. 中 上 断 传送 方式 

中 断 传送 方式 的 具体 过 程 是 : 当 CPU 需要 输入 或 输 
出 数据 时 , 先 做 一 些 必要 的 准备 工作 (有 时 包括 启动 外 部 设 图 8.4 中 断 及 其 处 理 过 程 的 示意 图 
备 ) ,然后 继续 执行 程序 当 外 设 完成 一 个 数据 的 输入 或 输 
出 后 , 则 向 CPU 发 出 中 断 请 求 ,CPU 就 暂停 正在 执行 的 程序 , 转 去 执行 输入 或 输出 操作 ,在 完 
成 输入 或 输出 操作 后 ,返回 原 程序 继续 执行 。 

中 断 传送 方式 是 CPU 和 外 部 设备 进行 输入 或 输出 的 有 效 方式 ,一 直 被 大 多 数 计算 机 系 
统 所 采用 , 它 可 以 避免 因 反 复查 询 外 设 的 状态 而 浪费 时 间 , 从 而 提高 CPU 的 工作 效率 。 不 
过 ,每 中 断 一 次 ,只 传送 一 次 数据 ,数据 传送 的 效率 并 不 高 ,所 以 中 断 传送 方式 一 般 用 于 低速 外 
设 。 另 外 ,与 查询 传送 方式 相 比 , 中 断 传送 方式 实现 比较 复杂 ,对 硬件 要 求 也 较 多 。 
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8.3.2 中 断 向 量 表 


1. 中 断 向 量 表 

为 了 便于 响应 处 理 ,给 中 断 类 型 编号 是 一 个 简单 的 方法 。 

IA-32 系列 CPU 共 能 支持 256 种 类 型 的 中 断 , 分 别 编号 为 0 一 255。 把 这 种 编号 称 为 中 断 
类 型 号 ,简称 中 断 号 。CPU 规定 了 一 些 中 断 的 类 型 号 。 例 如 ,属于 内 部 中 断 的 除法 出 错 ,其 中 
断 类 型 号 为 0。 系 统 还 可 以 通过 配置 的 方式 ,设置 部 分 中 断 的 类 型 号 。 例 如 ,属于 外 部 中 断 的 
键盘 中 断 ,其 中 断 类 型 号 为 9。 

把 中 断 处 理 程序 的 入口 地 址 称 为 中 断 向 量 。 事实 上 , 它 相 当 于 一 个 指向 中 断 处 理 程序 的 
指针 。 又 一 次 说 明 ,指针 就 是 地 址 。 

综 上 所 述 ,系统 中 存在 多 个 中 断 源 ,有 多 个 对 应 的 
中 断 处 理 程序 ,也 就 有 多 个 中 断 向 量 。 为 了 使 系统 在 
响应 中 断 时 , CPU 能 快速 地 转 入 对 应 的 中 断 处 理 程 。 00400 
序 , 采 用 一 张 表 来 保存 这 些 中 断 向 量 , 把 该 表 称 为 中 断 00pc 
向 量 表 。 中 断 向 量 表 的 每 一 项 也 依次 编号 为 0 一 255， 
1 号 中 断 向 量 就 是 中 断 类 型 为 的 中 断 处 理 程序 的 入 
口 地址 。 因 此 ,一 般 不 再 区 分 中 断 类 型 号 和 中 断 向 。 00008 
量 号 。 01 号 中 断 向 量 

中 断 向 量 表 如 图 8. 5 所 示 , 它 被 安排 在 内 存 最 低 。 “"" [os 人 | 
端的 1KB 空间 中 。 其 中 ,每 个 中 断 向 量 占用 4 个 字 00000 一 0 时 和 时 外 各 
节 , 低 地 址 两 个 字 节 是 中 断 处 理 程序 人口 地 址 的 偏 移 ， 国 5 由 凡 光 是 泊 
高 地 址 两 个 字 节 是 中 断 处 理 程序 人 口 地 址 的 段 值 ,所 
以 含有 256 个 中 断 向 量 的 中 断 向 量 表 需 要 占用 1KB 内 存 空间 。 

顺便 说 一 下 ,中断 向 量 表 中 的 中 断 向 量 并 不 一 定 非 要 指向 中 断 处 理 程序 ,也 可 作为 指向 一 
组 数据 的 指针 。 当 然 , 如 果 中 断 向 量 m 没有 指向 中 断 处 理 程序 ,那么 就 不 应 该 发 生 类 型 号 为 
m 的 中 断 。 

2. 存 取 中 断 向 量 

按照 上 述 中 断 向 量 表 的 组 织 结构 和 在 内 存 中 的 位 置 ,根据 中 断 向 量 号 (中 断 类 型 号 ) 可 方 
便 地 计算 出 中 断 向 量 所 在 单元 的 地 址 。 假 设 中 断 向 量 号 为 w%, 则 中 断 向 量 所 在 单元 的 开始 地 
址 是 nX4。 于 是 ,可 以 方便 地 存 取 中 断 向 量 。 

【 例 8-11】 如 下 程序 片段 获取 1CH 号 中 断 向 量 , 并 保存 到 双 字 存储 单元 
OLDINTICH 中 。 








FF 号 中 断 向 量 





02 号 中 断 向 量 IKB 














MV 人 以 0 

WwW ESM ;使 得 BE-0 

WV ”以 [ES:1Gk] 

MV WD [ODINTIOH], AX ;保存 中 断 向 量 之 偏 移 
WV AX [ES:1oH 4 本 

MXV WOFD [ODINTIGH 2], AX ;保存 中 断 向 量 之 段 值 


【 例 8-12】 如 下 程序 片段 设置 09H 号 中 断 向 量 。 其 中 ,int09h_handler 是 9 号 中 断 处理 
程序 开始 的 标号 ,也 即 入 口 地 址 偏 移 ; 代码 段 寄存 器 CS 作为 段 值 ,表示 设置 的 9 号 中 断 处 理 
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程序 与 当前 代码 段 在 同一 个 段 。 


MV 人 以 0 
MV DS, MX :使 得 D0 
Ql ;关中 断 ! 


MN WORD [9+4], intOmh_ handler 


SIl ; 开 中 断 ! 

在 上 面 的 程序 片段 中 ,使 用 了 关中 断 指令 CLI, 目 的 是 保证 真正 设置 中 断 向 量 的 两 条 传送 
指令 能 够 连续 执行 。 在 执行 完 前 一 条 传送 指令 后 ,n 号 中 断 向 量 就 暂时 被 破坏 , 既 不 指向 原 中 
断 处 理 程序 ,也 不 指向 新 的 中 断 处 理 程 序 。 如 果 此 时 发 生 类 型 为 的 中 断 ,那么 就 不 能 正确 地 
转 到 中 断 处 理 程序 执行 ,这 是 最 糟糕 的 事 了 。 如 果 能 确定 当前 是 关中 断 状态 ,当然 就 不 再 需要 
使 用 该 关中 断 指令 ,也 不 需要 随后 的 开 中 断 指令 。 另 外 ,如 果 能 肯定 在 设置 号 中 断 向 量 的 过 
程 中 不 发 生 类 型 为 n 的 中 断 ,那么 可 不 考虑 是 否 为 关中 断 状态 ,这 种 情况 只 有 在 对 应 的 中 断 处 
理 程序 仅 供应 用 程序 自己 使 用 时 才 有 可 能 。 


8.3.3 中断 响应 过 程 


1. 中 断 响应 过 程 

现在 来 看 实 方式 下 IA-32 系列 CPU 响应 中 断 的 具体 过 程 。 

通常 CPU 在 执行 完 每 一 条 指令 后 将 检测 是 否 有 中 断 请 求 , 在 有 中 断 请 求 且 满 足 一 定 条 
件 时 就 响应 中 断 , 其 过 程 如 图 8.6 所 示 。 

在 响应 中 断 的 过 程 中 ,由 硬件 自动 完成 以 下 工作 。 

(1) 取得 中 断 类 型 号 。 

(2) 把 标志 寄存 器 内 容 压 和 人 堆栈 。 

(3) 禁止 外 部 中 断 和 单 步 中 断 ( 使 得 标志 寄存 器 中 的 标志 位 IF 和 TF 为 0)。 

(4) 把 中 断 返 回 地 址 的 段 值 和 偏 移 压 人 堆栈 ,( 一 般 是 被 中 断 程 序 的 下 一 条 要 执行 指令 的 
地 址 , 即 当 前 CS 和 IP)。 

(5) 根据 中 断 类 型 号 从 中 断 向 量 表 中 取得 中 断 处 理 程序 入 口 地 址 。 

(6) 转 人 中 断 处 理 程序 。 

关于 内 部 中 断 、 不 可 屏蔽 中 断 和 可 屏蔽 中 断 等 ,将 在 下 面具 体 介 绍 。IF 是 中 断 允 许 标志 
(Interrupt-enable Flag) ,处 于 标志 寄存 器 中 的 位 9。TF 是 陷阱 标志 (Trap Flag) ,处 于 标志 寄 
存 器 的 位 8。 它们 都 属于 系统 标志 ,其 作用 将 在 下 面具 体 说 明 。 

在 实 方式 下 CPU 响应 中 断 时 ,将 把 标志 寄存 器 FLAGS 的 内 容 (16 位 ) 压 入 堆栈 ,还 将 把 
中 断 返 回 地 址 的 段 值 和 偏 移 (CS 和 IP) 压 入 堆栈 。 堆 栈 变化 如 图 8. 7 所 示 。 与 段 间 过 程 调用 
相 比 ,不 仅 把 返回 地 址 压 人 堆栈 ,还 先 把 标志 寄存 器 值 压 人 人 堆栈。 实际 上 ,如 图 8. 6 所 示 ,在 响 
应 中 断 时 ,将 清 标志 寄存 器 中 两 个 标志 位 IF 和 TF。 中 断 处 理 程序 在 最 后 从 堆栈 中 弹出 返回 
地 址 和 原 标 志 值 结束 中 断 ,返回 被 中 断 的 程序 。 

2. 中 断 返 回 指令 

通常 ,中断 处 理 程序 将 利用 中 断 返回 指令 返回 被 中 断 的 程序 。 

中 断 返 回 指令 的 格式 如 下 : 

IFET 
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完成 当前 指令 

















执行 下 条 























识别 中 断 ,取得 类 型 号 

















压 栈 标志 值 


禁止 单 步 (TF 清 0) 
禁止 中 断 (IF 清 0) 








压 栈 返 回 地 址 


根据 中 断 类 型 号 
取得 中 断 向 量 
了 














转 中 断 处 理 程序 

















中 断 返 回 时 ,从 堆栈 中 
恢复 IP、CS 和 FLAGS 








图 8.6 实 方式 下 的 中 断 响应 过 程 












































堆栈 底部 堆栈 底部 
ESP 
标志 寄存 器 值 
返回 地 址 段 值 
ESP 一 =| 返回 地 址 偏 移 
(a) 响应 中 断 前 的 堆栈 (b) 响应 中 断后 的 堆栈 


图 8.7 响应 中 断 前 后 的 堆栈 示意 图 
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该 指令 在 实 方式 下 的 具体 操作 为 : 先 从 堆栈 弹出 一 个 字 到 指令 指针 寄存 器 IP; 然后 从 堆 
栈 弹 出 一 个 字 到 代码 段 寄存 器 CS; 最 后 从 堆栈 弹出 一 个 字 到 标志 寄存 器 FLAGS。 因 此 , 利 
用 该 指令 不 仅 能 够 返回 被 中 断 的 程序 ,而 且 还 能 够 恢复 标志 寄存 器 值 。 

在 执行 中 断 返 回 指令 IRET 时 的 堆栈 变化 是 从 图 8. 7(b) 变 化 到 图 8.7(a)。 在 处 理 中 断 
过 程 的 结尾 ,该 指令 使 得 堆栈 保持 平衡 。 

与 段 间 返回 指令 RETF 相 比 ,中断 返回 指令 IRET 不 仅 从 堆栈 弹出 返回 地 址 的 偏 移 和 段 
值 , 而 且 还 弹出 被 保存 的 标志 寄存 器 值 。 


8.3.4 内 部 中 断 


由 发 生 在 CPU 内 部 的 某 个 事件 引起 的 中 断 被 称 为 内 部 中 断 。 由 于 内 部 中 断 是 CPU 在 
执行 某 些 指令 时 产生 ,因此 也 称 为 软件 中 断 。 其 特点 是 : 不 需要 外 部 硬件 的 支持 ; 不 受 中 断 
允许 标志 IF 的 控制 。 

1. 除法 出 错 中 断 (类 型 号 0) 

除法 出 错 是 典型 的 内 部 中 断 。 在 执行 除法 指令 时 ,如 果 CPU 发 现 除数 为 0 或 者 商 超过 了 
规定 的 范围 ,那么 就 将 引起 一 个 除法 出 错 中 断 , 其 中 断 类 型 号 规定 为 0。 

【 例 8-13〗 在 3.2 节 的 例 3-13 中 介绍 过 以 下 的 代码 片段 。 

WW A,én 
WW BL,2 
DV BE& 商 太 大 ,引起 0 号 中 断 

执行 上 述 代码 ,将 导致 一 个 0 号 类 型 的 中 断 , 于 是 会 切换 执行 0 号 中 断 处 理 程序 。 

在 8.4.2 节 中 ,将 举例 说 明 0 号 中 断 处 理 程序 的 设计 。 

2. 单 步 中 断 ( 类 型 号 1) 

当 陷 阱 标志 TF 为 1, 则 在 每 条 指令 执行 后 引起 一 个 单 步 中 断 , 其 中 断 类 型 号 规定 为 1。 
出 现 单 步 中 断后 ,CPU 就 执行 1 号 中 断 处 理 程序 ,也 即 单 步 中 断 处 理 程序 。 由 于 在 响应 中 断 
时 CPU 已 把 TF 置 为 0, 因 此 不 会 以 单 步 方 式 执行 单 步 中 断 处 理 程序 。 

通常 由 调试 工具 (如 DEBUG 等 ) 把 TF 置 为 1, 在 执行 完 一 条 被 调试 程序 的 指令 后 ,就 转 
入 单 步 中 断 处 理 程序 ,一 般 情况 下 单 步 中 断 处 理 程 序 报告 各 寄存 器 的 当前 内 容 , 程 序 员 可 据 此 
调试 程序 。 

3. 断 点 中 断 ( 类 型 号 3) 

在 调试 程序 时 ,通过 设置 断 点 ,能 够 提高 调试 效率 。 

IA-32 系列 CPU 提供 了 一 条 特殊 的 中 断 指令 “INT 3”, 调 试 工具 或 集成 开发 环境 可 用 
它 蔡 换 断 点 处 的 代码 , 当 CPU 执行 这 条 中 断 指令 后 ,就 引起 类 型 号 为 3 的 中 断 。 把 这 种 中 断 
称 为 断 点 中 断 。 通 常情 况 下 , 断 点 中 断 处 理 程 序 恢复 被 替换 的 代码 ,并 报告 各 寄存 器 的 当前 内 
容 ,程序 员 可 据 此 调试 程序 。 所 以 说 中 断 指 令 *INT 3? 特殊 是 因为 它 只 有 一 个 字 节 长 ,其 他 
的 中 断 指 令 INT 长 两 个 字 节 。 

4. 溢出 中 断 (类 型 号 4) 

IA-32 系列 CPU 提供 了 一 条 专门 检测 运算 溢出 的 指令 ,该 指令 的 格式 如 下 : 

INIO 


在 溢出 标志 OF 置 1 时 .如 果 执 行 该 指令 , 则 引起 溢出 中 断 , 其 类 型 号 规定 为 4。 如 果 洲 出 
标志 OF 为 0, 则 执行 该 指令 后 并 不 会 引起 溢出 中 断 。 
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5. 中 了断 指 令 INT 引起 的 中 断 
有 时 可 以 把 中 断 处 理 程序 作为 子 程序 来 看 待 。 例 如 ,以 中 断 处 理 程序 形式 存在 的 BIOS 
功能 和 操作 系统 功能 等 。 
为 了 方便 地 调用 中 断 处 理 程序 ,IA-32 系列 CPU 提供 了 中 断 指令 。 
中 断 指令 的 一 般 格式 如 下 : 
INT n 


其 中 ,n 是 一 个 0~~255 的 立即 数 。CPU 在 执行 这 条 中 断 指令 后 , 便 引起 一 个 类 型 号 为 n 
的 中 断 ,从 而 转 入 对 应 的 中 断 处 理 程序 。 

在 前 面 的 章节 中 ,介绍 了 利用 指令 “INT 10H”, 调 用 作为 BIOS 的 显示 1/O 程序 。 当 
CPU 执行 该 指令 后 ,就 引起 一 个 类 型 号 为 10H 的 中 断 ,从 而 转 入 10H 号 中 断 处 理 程序 ,也 即 
转 入 显示 1/O 程序 。 类 似 地 ,利用 指令 “INT 16H”, 调 用 作为 BIOS 的 键盘 1/O 程序 ,利用 
指令 “INT 21H”, 调 用 DOS 系统 功能 ,相关 过 程 都 是 如 此 。 

值得 指出 的 是 ,程序 员 根 据 需 要 在 程序 中 安排 中 断 指令 ,所 以 它 不 会 真正 随机 产生 ,而 完 
全 受 程 序 控 制 。 


8.3.5 外 部 中 断 


由 发 生 在 CPU 外 部 的 某 个 事件 引起 的 中 断 被 称 为 外 部 中 断 。 由 外 部 设备 接口 (控制 器 ) 
引起 的 中 断 是 典型 的 外 部 中 断 。 外 部 中 断 以 完全 随机 的 方式 中 断 当前 正在 执行 的 程序 。 
IA-32 系列 CPU 有 两 条 外 部 中 断 请 求 线 : INTR 接收 可 屏蔽 中 断 请 求 和 NMI 接收 非 屏蔽 中 
断 请 求 。 

1. 可 屏蔽 中 断 

1) 中 断 控制 器 8259A 

在 早期 的 PC 系列 及 其 兼容 机 中 ,键盘 和 硬盘 等 外 设 的 中 断 请 求 都 通过 中 断 控制 器 
8259A 传 给 CPU 的 可 屏蔽 中 断 请 求 线 INTR ,如 图 8. 8 所 示 。 中 断 控 制 器 8259A 共 能 接收 8 
个 独立 的 中 断 请 求 信号 IR0 一 IR7。 系 统 中 有 两 个 中 断 控制 器 8259A 芯片 ,一 主 一 从 ,从 片 
8259A 连接 到 主 片 8259A 的 IR2 上 ,这 样 系统 就 可 接收 15 个 独立 的 中 断 请 求 信号 。 

中 断 控 制 器 8259A 在 控制 外 设 中 断 方面 起 着 重要 的 作用 。 如 果 接 收 到 一 个 中 断 请 求 信 
号 ,并 且 满 足 一 定 的 条 件 ,那么 它 就 把 中 断 请 求 信号 传 到 CPU 的 可 屏蔽 中 断 请 求 线 INTR ,以 
使 CPU 感知 到 有 外 部 中 断 请 求 ; 同时 也 把 相应 的 中 断 类 型 号 送 给 CPU ,使 CPU 在 响应 中 断 
时 可 根据 中 断 类 型 号 取得 中 断 向 量 ,从 而 转 入 对 应 的 中 断 处 理 程序 。 

















INTR IR0 一 定时 器 IR8 = 一 RTC 时 钟 

IR1 = 一 键盘 IR9 <— … 
Ni sh IRI0—— 
LNN i 8259A JRII- 一 
CPU 主 片 IR4[ 上 ~- 一 从 片 ”12 一 
IR5 上 -一 IRI3 上 -一 
IR6 上 -一 IR14=— 

IR7 上 -一 … IR15- 一 … 


























图 8.8 可 屏蔽 外 部 中 断 连 接 示意 图 


中 断 控制 器 8259A 是 可 编程 的 ,也 就 是 说 可 由 程序 设置 它 如 何 控制 中 断 。 从 程序 设计 的 
角度 看 ,中 断 控 制 器 8259A 包含 中 断 请 求 寄存 器 (IRR) 中断 屏 项 寄存 器 (IMR)、 中 断 服务 寄 
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存 器 (ISR) 等 一 组 寄存 器 ,它们 决定 了 8259A 的 工作 方式 ,决定 了 传 出 一 个 中 断 请 求 信号 所 需 
要 满足 的 条 件 。 在 PC 系统 中 , 主 片 8259A 的 两 个 端口 地 址 分 别 是 20H 和 21 了 ,从 片 8259A 
的 两 个 端口 地 址 分 别 是 AoH 和 Al1H。 在 PC 系统 加 电 初 始 化 期 间 , 已 对 8259A 进行 过 初始 
化 。 随 后 ,通过 发 出 相关 的 操作 命令 字 , 可 以 有 效 地 掌控 外 设 中 断 。 

在 初始 化 时 规定 了 在 传 出 中 断 请 求 IR0 一 IR7 时 ,送出 的 对 应 中 断 类 型 号 分 别 为 08H 一 
0FH, 也 即 定时 器 的 中 断 类 型 号 为 8. 键盘 的 中 断 类 型 号 为 9。 对 应 地 ,8 号 中 断 向 量 是 对 应 定 
时 器 的 中 断 处 理 程序 入 口 地 址 ; 9 号 中 断 向 量 是 对 应 键盘 的 中 断 处 理 程序 入 口 地 址 。 在 初始 
化 时 ,还 规定 对 应 中 断 请 求 I 了 R8 一 IR15 的 中 断 类 型 号 为 70H 一 77H。 

2) 中 断 屏 蔽 操作 命令 字 

利用 中 断 屏蔽 操作 命令 字 ,能 够 屏蔽 中 断 源 的 中 断 请 求 。 中 断 屏蔽 操作 命令 字 长 8 位 ,每 
一 位 对 应 一 路 中 断 请 求 。 当 第 i 位 为 0 时 ,表示 允许 传 出 来 自 IR; 的 中 断 请 求 信 号 , 当 第 i 位 
为 1 时 ,表示 禁止 传 出 来 自 IRi 的 中 断 请 求 信号 。 

在 PC 系统 中 ,向 主 片 8259A 发 出 中 断 屏蔽 命令 字 的 端口 地 址 是 21H。 

【 例 8-14】 利用 中 断 控制 器 8259A ,屏蔽 键盘 中 断 。 

如 图 8. 8 所 示 ,键盘 的 中 断 请 求 线 连接 在 主 片 8259A 的 IR1 上 。 为 了 使 中 断 控制 器 
8259A 不 传 出 来 自 键盘 的 中 断 请求 信 号 ,可 发 出 中 断 屏蔽 操作 命令 字 00000010B, 程序 片段 
如 下 : 

WV A O00000IB 
Or 2HA 

注意 ,如 果真 的 这 样 做 了 ,键盘 似乎 就 失效 了 。 

3) 可 屏蔽 中 断 

从 图 8. 8 可 知 , 尽 管 中 断 控制 器 把 外 设 的 中 断 请 求 信号 由 INTR 传 给 CPU ,但 CPU 是 否 
响应 还 取决 于 标志 寄存 器 FLAGS 的 中 断 允 许 标志 IF。 如 果 IF 为 0, 则 CPU 仍 不 响应 由 
INTR 传人 的 中 断 请 求 ; 只 有 在 IF 为 1 时 ,CPU 才 响 应 由 INTR 传人 的 中 断 请 求 。 所 以 ,由 
INTR 传人 的 外 部 中 断 请 求 被 称 为 可 屏蔽 的 外 部 中 断 请 求 , 由 此 引起 的 中 断 被 称 为 可 屏蔽 中 
断 。 由 于 外 设 的 中 断 请 求 均 由 INTR 传 给 CPU, 因 此 , 当 IF 为 0 时 .CPU 不 响应 所 有 外 设 中 
断 请 求 ; 当 IF 为 1 时 , 才 响 应 外 设 中 断 请 求 。 

使 得 CPU 响应 外 设 中 断 请 求 被 称 为 开 中 断 (IF==1) ,反之 被 称 为 关中 断 (IF==0)。 有 专门 
的 开 中 断 和 关中 断 指 令 。 

开 中 断 指令 如 下 , 它 设置 中 断 允许 标志 IF: 

STI 

关中 断 指 令 如 下 , 它 清除 中 断 允 许 标 志 IF: 

al 

CPU 在 响应 中 断 时 会 自动 关中 断 , 从 而 避免 在 中 断 过 程 中 再 响应 其 他 外 设 中 断 。 当 然 ， 
程序 员 也 可 根据 需要 在 程序 中 安排 关中 断 指 令 CLI 和 开 中 断 指 令 STI。 

因此 ,在 PC 系列 及 其 兼容 机 中 ,所 有 的 外 设 中 断 均 是 可 屏蔽 中 断 。CPU 响应 某 个 外 设 
中 断 请 求 的 两 个 必要 条 件 是 : CPU 处 于 开 中 断 状态 和 中 断 控 制 器 没有 屏蔽 对 应 外 设 中 断 请 
求 信和 号。 通过 对 这 两 个 必要 条 件 的 控制 ,可 使 CPU 响应 某 些 外 设 中 断 请 求 ,而 不 响应 另外 一 
些 外 设 中 断 请 求 。 
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2. 非 屏蔽 中 断 

由 NMI 传人 的 外 部 中 断 请求 被 称 为 非 屏 项 外 部 中 断 请 求 , 由 此 而 引起 的 中 断 被 称 为 非 屏 
蔽 中 断 (不 可 屏蔽 中 断 ) 。 从 图 8. 8 可 见 , 当 收 到 从 NMI 传 来 的 中 断 请 求 信号 时 ,不 论 是 否 处 
于 开 中 断 状态 ,CPU 总 会 响应 。 所 以 ,不 可 屏蔽 中 断 请 求 由 电源 掉 电 、 存 储 器 出 错 或 者 总 线 奇 
偶 校 验 错 等 紧急 事件 导致 ,要 求 CPU 及 时 处 理 。 

非 屏 项 中 断 的 中 断 类 型 号 规定 为 2。CPU 在 响应 非 屏蔽 中 断 请 求 时 ,总 是 转 人 由 2 号 中 
断 向 量 所 指定 的 中 断 处 理 程序 。 


8.3.6 ”中断 优 先 级 和 中 断 嵌 套 


1. 中 断 优先 级 
系统 中 有 多 个 中 断 源 , 当 多 个 中 断 源 同 时 向 CPU 发 出 中 断 请 求 时 ,CPU 按 规定 的 优先 级 
响应 中 断 请 求 。 根 据 图 8. 6 所 示 的 中 断 响应 过 程 ,响应 中 断 的 优先 顺序 如 下 : 
优先 级 最 高 内 部 中 断 ( 除 出 错 ,INTO,INT ) 





| 非 屏蔽 中 断 CNMI ) 
可 屏蔽 中 断 (INTR ) 
最 低 单 步 中 断 


如 图 8. 8 所 示 ,外 设 的 中 断 请 求 都 通过 中 断 控制 器 8259A 传 给 CPU 的 INTR 引线 。 在 
对 主 片 8259A 初始 化 时 规定 了 8 个 优先 级 ,优先 级 顺序 如 下 : 
IRO,IR1,1R2,1R3,1R4,1R5,IR6,IR7 
在 对 中 断 控制 器 8259A 初始 化 时 规定 ,在 CPU 响应 某 个 外 设 的 中 断 请 求 后 ,中 断 控制 器 
8259A 不 再 传 出 优先 级 相同 或 较 低 的 外 设 中 断 请 求 ,直到 它 接收 到 中 断 结束 操作 命令 为 止 。 
例如 ,CPU 在 响应 来 自 IR1 的 9 号 键盘 中 断后 , 主 片 8259A 就 不 再 传 出 来 自 IR1 一 IR7 的 外 
设 中 断 请 求 , 直 到 通知 主 片 8259A 其 IR1( 键 盘 中 断 ) 上 的 中 断 处理 已 结束 为 止 。 所 以 ,在 外 设 
中 断 处 理 程序 结束 时 ,要 通知 8259A 中 断 已 结束 ,以 便 使 8259A 传 出 中 断 级 相同 或 较 低 的 外 
设 中 断 请 求 , 从 而 使 CPU 响应 它们 。 
表示 当前 中 断 处 理 已 经 结束 的 中 断 结束 命令 字 的 值 是 20H。 在 PC 系统 中 ,向 主 片 
8259A 发 出 中 断 结束 命令 字 的 端口 地 址 是 20H。 因 此 ,以 下 程序 片段 通知 8259A 当前 中 断 
结束 。 
WW A 2H 
Or 2HA 
注意 ,通知 中 断 控制 器 8259A 当前 中 断 结束 ,并 非 中 断 返 回 。 只 有 在 执行 了 中 断 返 回 指 
令 后 ,中 断 程 序 才 真 正 返回 。 
在 对 8259A 初始 化 时 如 此 设置 ,可 以 使 得 CPU 在 响应 外 设 中 断 请 求 后 ,只 要 开 中 断 , 那 
么 就 可 响应 优先 级 高 的 外 设 中 断 请 求 ,而 不 会 响应 优先 级 相同 或 低 的 外 设 中 断 请求 。 
2. 中 断 谋 套 
CPU 在 执行 中 断 处 理 程序 时 ,又 发 生 中 断 ,这 种 情况 被 称 为 中 断 说 套 。 
在 中 断 处 理 过 程 中 ,发 生 内 部 中 断 ,引起 中 断 嵌 套 是 经 常 的 事 。 例 如 ,CPU 在 执行 中 断 处 
理 程序 时 , 遇 到 软 中 断 指令 ,就 会 引起 中 断 嵌 套 。 
在 中 断 处 理 过 程 中 ,发 生 非 屏蔽 中 断 ,也 会 引起 中 断 谋 套 。 
由 于 CPU 在 响应 中 断 的 过 程 中 ,已 自动 关中 断 ,因此 CPU 也 就 不 会 再 自动 响应 可 屏蔽 
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中 断 。 如 果 需 要 在 中 断 处 理 过 程 的 某 些 时 候 响 应 可 屏蔽 中 断 ,那么 可 在 中 断 处 理 程序 中 安排 
开 中 断 指令 ,CPU 在 执行 开 中 断 指令 后 ,就 处 于 开 中 断 状态 ,也 就 可 以 响应 可 屏蔽 中 断 了 , 直 
到 再 关中 断 。 所 以 ,如 果 在 中 断 处 理 程序 中 使 用 了 开 中 断 指令 ,也 就 可 能 会 发 生 可 屏蔽 中 断 引 
起 的 中 断 嵌 套 。 


8.4 中 断 处 理 程序 设计 


为 了 理解 系统 的 工作 原理 ,至 少 需要 了 解 中 断 处 理 程序 的 工作 流程 。 中 断 处 理 程序 总 是 
在 后 台 运行 ,而 且 与 硬件 平台 关系 密切 。 本 节 以 键盘 中 断 处 理 程序 为 例 , 说 明 外 设 中 断 处 理 程 
序 的 设计 ; 以 除法 出 错 中 断 处 理 程序 为 例 , 说 明 内 部 中 断 处 理 程序 的 设计 ; 还 举例 说 明子 程 
序 形式 的 软 中 断 处 理 程序 的 设计 。 


8.4.1 键盘 中 断 处 理 程序 


在 PC 及 其 兼容 机 系统 中 ,初始 化 后 BIOS 最 初 设 定 键盘 中 断 的 类 型 为 9, 键盘 中 断 处 理 
程序 是 9 号 中 断 处 理 程序 。 

1. 前 导 过 程 

按 8. 3 节 介 绍 ,进入 键盘 中 断 处 理 程序 的 前 导 过 程 为 : 如 图 8. 8 所 示 , 当 用 户 按 下 键盘 ， 
那么 键盘 设备 传递 请 求 信 号 到 中 断 控制 器 8259A 的 IR1; 当中 断 控 制 器 没有 屏蔽 键盘 中 断 ， 
而 且 更 高 级 别 的 定时 中 断 或 者 之 前 的 键盘 中 断 处 理 已 经 结束 ,那么 8259A 传 出 来 自 IR1 的 请 
求 信号 到 CPU 的 INTR; 如 图 8.6 所 示 , 当 没有 优先 级 更 高 的 内 部 中 断 或 不 可 屏蔽 中 断 ,并 且 
开 中 断 的 情况 下 ,就 响应 键盘 中 断 , 转 入 9 号 键盘 中 断 处 理 程序 。 

看 似 存在 多 个 条 件 , 但 响应 键盘 中 断 的 条 件 几乎 总 是 满足 的 。 

2. 程序 功能 

键盘 中 断 处 理 程序 的 主要 功能 是 : 先 从 键盘 接口 取得 所 按键 的 扫描 码 ; 然后 根据 扫描 码 
判定 所 按 的 键 并 作 相应 的 处 理 。 它 把 字符 键 的 扫描 码 和 对 应 的 ASCII 码 存 到 键盘 缓冲 区 ; 把 
功能 键 的 扫描 码 存 到 键盘 缓冲 区 ; 记录 下 控制 键 和 双 态 键 的 状态 ; 直接 处 理 特殊 请 求 键 。 

键盘 缓冲 区 是 位 于 BIOS 数据 区 的 一 个 先进 先 出 的 环形 队列 。 

一 般 情 况 下 ,程序 应 该 调用 BIOS 提供 的 键盘 1/O 程序 取得 用 户 的 键盘 输入 。 在 7.1.2 
节 介 绍 了 键盘 1/O 程序 及 其 调用 方法 。 

图 8.9 给 出 了 键盘 中 断 处 理 程序 键盘 缓冲 区 和 键盘 1/O 程序 三 者 之 间 的 关系 。 如 果 采 
用 生产 者 和 消费 者 来 描述 ,那么 键盘 中 断 处 理 程序 相当 于 生产 者 ,键盘 1/O 程序 相当 于 消费 
者 ,键盘 缓冲 区 就 是 仓库 。 

3. 示例 程序 

为 了 说 明 外 部 设备 中 断 处 理 程序 的 设计 要 点 ,现在 来 看 一 个 简化 的 键盘 中 断 处 理 程序 。 

【 例 8-15】〗 设计 一 个 新 的 键盘 中 断 处 理 程序 。 

为 了 观察 新 的 键盘 中 断 处 理 程 序 的 实际 效果 ,演示 程序 由 两 部 分 组 成 。 第 一 部 分 是 初始 
化 和 演示 处 理 : 首先 设置 9 号 中 断 向 量 , 使 其 指向 新 的 键盘 中 断 处 理 程序 ; 然后 接受 用 户 按 
键 ,并 显示 所 得 字符 ,直到 当 用 户 按 回 车 键 为 止 。 这 相当 于 一 个 显示 用 户 所 按键 的 普通 应 用 程 
序 。 第 二 部 分 是 新 的 简化 了 的 键盘 中 断 处 理 程序 。 它 从 键盘 接口 取得 用 户 所 按键 的 扫描 码 ， 
并 根据 扫描 码 进 行 相应 的 处 理 , 在 完成 处 理工 作 后 ,通知 中 断 控制 器 8259A 中 断 结 束 ,最 后 中 
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应 用 程序 键盘 
个 


键盘 1/O 程 序 键盘 中 断 处 理 程序 





















































键盘 缓冲 区 
8.9 键盘 中 断 处 理 程序 .键盘 缓冲 区 和 键盘 1/O 程序 三 者 之 间 的 关系 


断 返 回 。 演 示 程 序 dp84. asm 如 下 : 
;演示 键盘 中 断 处 理 程序 ( 采用 虚拟 机 可 加 载 格式 ) 
PORT_KEY DAT EW 0 
PORT_KEY_STA EW 0 


section text 
bits 16 
;可 加 载 工 作 程 序 头 部 特征 信息 
Signature db ”YANG" ;签名 信息 
Version dn 1 ;格式 版 本 
Length dn end_of text ;工作 程序 长 度 
Start dy Begin ;工作 程序 入 口 点 的 偏 移 
Zoneseg dy 1500H ;工作 程序 入 口 点 的 段 值 ( 期 望 ) 
Reserved dd 0 ;保留 
Begin: ;演示 程序 的 初始 化 
MX 以 0 ;准备 设置 中 断 向 量 
WN Ds, A 
Ql 
MX WORD [ 9+ 4] ,intOph_handler 
MN [9+4+2], CS ;启用 新 的 键盘 中 断 处 理 程序 
STI 
Next: ;演示 程序 的 演示 处 理 
MX A 0 ;调用 键盘 10 程 序 
INT 14H ;获取 用 户 按键 
WA ;显示 取得 的 字符 ( 按键 ) 
INT 10H 
OP AL OH ; 回 车 键 吗 ? 
JNZ Next :否则 继续 
MO Ah 4 ;为 了 演示 效果 
MO AL ONH ;显示 一 个 换行 





IN AL, PORT_KEY_DAT 
STI 

CAL IntOhfun 

Ql 

MN AL OAEH 

OUT PORT_KEY SIA AL 
MX AL 2H 

OUT 20H 作 


;结束 ( 返回 到 加 载 器 ) 
;新 的 9 号 键盘 中 断 处理 程 序 
;保护 通用 寄存 器 


;禁止 键盘 发 送 数据 到 接口 
;从 键盘 接口 读 取 按键 扫描 码 


; 开 中 断 
;完成 相关 功能 


;关中 断 
;允许 键盘 发 送 数据 到 接口 


;通知 中 断 控制 器 829A 
;当前 中 断 处 理 已 经 结束 


:恢复 通用 寄存 器 


;演示 所 号 中 断 处 理 程序 的 具体 功能 
浏 断 回 车 键 的 扫描 码 

非 回 车 键 , 则 转移 

; 回 车 键 ,保存 扫描 码 

; 回 车 键 Ascll 码 


; 仅 识别 处 理 QERIYIOP 这 10 个 键 
;判断 字母 0 键 扫描 码 

; 低 于 , 则 直接 丢弃 

浏 断 字母 P 键 扫描 码 

高 于 , 则 直接 丢弃 

;保存 扫描 码 

按 演示 方案 转换 成 对 应 的 ASCN 码 


;保存 到 键盘 缓冲 区 


;把 扫描 码 和 ASCII 码 存 人 键盘 缓冲 区 
;保护 只 


:DS= 004H 
; 取 队 列 的 尾 指针 
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MX Sl, BX ;SE= 队列 尾 指针 
ADD SI, 2 :SI= 下 一 个 可 能 位 置 
OP SI，009HH ; 越 出 缓冲 区 界 吗 ? 
B .LUBI ;没有 , 则 转移 
MOV SI, OoEH 是 的 ,循环 到 缓冲 区 头 部 
.LAB1: 
OP SI，[ooAH ;与 队列 头 指针 比较 
.Ue ;相等 表示 ,队列 已 经 满 
MX [BX], AX ;把 扫描 码 和 ASCN 码 填 人 队列 
MX [LootoH], sl ;保存 队列 尾 指针 
.LAB2: 
POP DS 恢复 只 
RET ;返回 
end_of_text: ;结束 位 置 


值得 指出 的 是 ,在 加 载运 行 本 程序 后 ,只 有 11 个 键 有 效 。 

下 面 对 上 述 键 盘 中 断 处 理 程序 的 实现 作 进 一 步 说 明 。 

(1) 键盘 接口 及 其 操作 。 在 PC 及 其 兼容 机 中 ,键盘 接口 的 两 个 端口 地 址 分 别 是 60H 和 
64 也 。 向 键盘 接口 发 出 0ADH 命令 ,表示 禁止 键盘 发 送 数据 到 键盘 接口 ,准备 读 取 键 盘 发 送 
到 接口 的 数据 ; 相反 地 ,向 键盘 接口 发 出 0AEH 命令 ,表示 允许 键盘 发 送 数 据 到 键盘 接口 。 
这 里 可 以 简单 地 认为 ,在 键盘 发 出 中 断 请 求 信和 号 时 ,已 经 把 用 户 所 按键 的 扫描 码 发 送 到 了 键盘 
接口 。 

(2) 扫描 码 的 处 理 。 为 了 突出 键盘 中 断 处 理 程序 的 流程 ,采用 一 个 子 程序 Int09hfun 实现 
“根据 扫描 码 进 行 相 应 的 处 理 ”。 为 了 进一步 简化 , 它 仅仅 识别 处 理 回 车 键 和 
“QWERTYUIOP” 这 11 个 键 的 扫描 码 , 而 且 把 这 10 个 字母 键 解释 成 为 0 一 9 这 10 个 数字 键 。 
实际 上 ,还 没有 区 分 字母 的 大 小 写 。 所 谓 解释 ,就 是 根据 扫描 码 转 换 成 对 应 的 ASCII 码 。 当 
然 这 只 是 示例 。 但 另 一 方面 也 说 明了 ,键盘 中 断 处 理 程序 可 以 被 赋予 的 功能 。 如 何 编写 一 个 
有 特点 但 较 完善 的 键盘 中 断 处 理 程 序 , 留 为 作业 。 

(3) 键盘 缓冲 区 及 其 存 取 。 在 子 程序 Int09hfun 中 调用 了 另 一 个 子 程 序 Enqueue 把 上 述 
按键 的 扫描 码 和 ASCII 码 存 和 键盘 缓冲 区 。 键 盘 缓 冲 区 位 于 BIOS 数据 区 ,其 结构 和 占用 的 
内 存 区 域 如 下 : 

BFF_ HED DW 00IBH :0040:001AH 
BFF TAL DW 00IBH :0040:001CH 
KB_BUFFR RW 16 :0040:001B+-— 00DH 

BUFF_HEAD 和 BUFF_TAIL 是 缓冲 区 的 头 指 针 和 尾 指针 。 作 为 环形 队列 的 缓冲 区 本 
身长 16 个 字 , 而 存放 一 个 键 的 扫描 码 和 对 应 的 ASCII 码 需 要 占用 一 个 字 , 所 以 键盘 缓冲 区 可 
实际 存放 15 个 键 的 扫描 码 和 ASCII 码 。 按 照 存 取 环 形 队 列 算法 , 当 尾 指针 将 要 赶 上 头 指针 
时 ,表示 缓冲 区 已 经 满 。 如 果 出 现 这 样 的 情况 ,作为 示例 采取 了 简单 丢弃 的 处 理 方法 。 

4. 外 设 中 断 处 理 程序 设计 

在 开 中 断 的 情况 下 ,外 设 中 断 的 发 生 是 随机 的 ,在 设计 外 设 中 断 处 理 程序 时 必须 充分 注意 
到 这 一 点 。 外 设 中 断 处 理 程序 的 主要 步骤 如 下 。 

(1) 必须 保护 现场 。 这 里 的 现场 可 理解 为 中 断 发 生 时 CPU 各 内 部 寄存 器 的 内 容 。CPU 
在 响应 中 断 时 ,已 把 标志 寄存 器 的 内 容 和 返回 地 址 压 入 堆栈 ,所 以 要 保护 的 现场 主要 是 指 通 用 
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寄存 器 的 内 容 和 除 代码 段 寄 存 器 外 的 其 他 段 寄存 器 的 内 容 。 因 为 中 断 的 发 生 是 随机 的 ,所 以 
凡是 中 断 处 理 程序 中 要 重新 赋值 的 各 寄存 器 的 原 有 内 容 必 须 先 予 保护 。 保 护 的 一 般 方法 是 把 
它们 压 入 堆栈 。 

(2) 尽快 完成 中 断 处 理 。 外 设 中 断 处 理 必须 尽快 完成 ,所 以 外 设 中 断 处 理 必须 追求 速度 
上 的 高 效率 。 因 为 在 进行 外 设 中 断 处 理 时 ,往往 不 再 响应 其 他 外 设 的 中 断 请 求 ,所 以 必须 快 ， 
以 免 影响 处 理 其 他 外 设 的 中 断 请 求 。 

(3) 恢复 现场 。 在 中 断 处 理 完成 后 ,依次 恢复 被 保护 寄存 器 的 原 有 内 容 。 

(4) 通知 中 断 控制 器 中 断 已 经 结束 。 

(5) 利用 IRET 指令 实现 中 断 返回 。 

此 外 ,应 及 时 开 中 断 。 除 非 必要 ,中 断 处 理 程序 应 尽早 开 中 断 , 以 便 CPU 响应 具有 更 高 
优先 级 的 中 断 请 求 。 


8.4.2 除法 出 错 中 断 处 理 程 序 


为 了 说 明 内 部 中 断 处 理 程序 的 设计 要 点 ,现在 来 看 一 个 简化 的 除法 出 错 中 断 处 理 程序 。 
从 8.3.4 节 可 知 ,IA-32 系列 CPU 的 除法 出 错 中 断 类 型 号 为 0。 

【 例 8-16】 设计 一 个 除法 出 错 中 断 处 理 程序 。 

为 了 能 够 观察 除法 出 错 中 断 处 理 程序 的 运行 效果 ,演示 程序 dp85. asm 分 为 两 部 分 。 第 
一 部 分 包含 初始 化 和 引起 除法 出 错 的 指令 。 初 始 化 的 工作 为 : 设置 0 号 中 断 向 量 , 使 其 指向 
除法 出 错 中 断 处理 程 序 。 第 二 部 分 是 除法 出 错 中 断 处 理 程序 ,为 了 简化 , 它 仅 仅 显示 提示 信 
息 。 演 示 程 序 dp85. asm 如 下 : 

;演示 除法 出 错 中 断 处 理 程序 ( 采用 虚拟 机 可 加 载 格式 ) 


section text 
bits 16 
;可 加 载 工 作 程 序 头 部 特征 信息 
Signature db ”YANG" ;签名 信息 
Version dw 1 ;格式 版 本 
Length dn end_of text ;工作 程序 长 度 
Start dy Begin ;工作 程序 入 口 点 的 偏 移 
Zoneseg dw 1800H ;工作 程序 入 口 点 的 段 值 ( 期 望 ) 
Reserved dd 0 ;保留 
Begin: ;演示 程序 的 初始 化 
MX 从 0 ;准备 设置 中 断 向 量 
WN DS 以 
Ql ;关中 断 
MO WORD [ok ,intOh_handler ;设置 0 号 中 断 向 量 的 偏 移 
MN [Or4+2], CS ;设置 0 号 中 断 向 量 的 段 值 
STI ; 开 中 断 
MO BH 0 
MX AL 人 4 
MV AL 虽 


INT 10H ;为 了 示意 ,显示 '#' 号 
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演示 除 出 错 


;除法 操作 溢出 We1 


:形成 回 车 
形成 换行 


;结束 ( 返回 到 加 载 器 ) 


:on 号 中 断 处 理 程序 ( 除 出 错 中 断 处 理 程序 ) 


intO0h_handler: 
STI 


ADD WORD [BP+ 18], 2 
POP DS 
POPA 


IRET 


mess db " Divide overflon", 


0 


; 开 中 断 Ma 2 
;保护 通用 寄存 器 Ma 3 
;保护 [Me 4 


;使 DS CS 

:指向 提示 信息 
;显示 提示 信息 
;调整 返回 地 址 1 Ma5 


恢复 只 
:恢复 通用 寄存 器 


;中 断 返 回 
;提示 信息 
;显示 字符 串 ( 以 0 结尾 ) 


;DE 字符 串 起 始 地 址 偏 移 


;结束 位 置 
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在 上 述 演示 程序 中 ,引起 除法 出 错 中 断 的 指令 是 “DIV BL”, 参 见 源 程 序 “//@1” 行 。 

从 上 述 源 程序 可 知 , 该 除法 出 错 中 断 处 理 程序 比较 简单 。 刚 开始 就 开 中 断 ; 接着 保护 通 
用 寄存 器 和 段 寄存 器 DS; 随后 ,显示 提示 信息 ; 最 后 恢复 被 保护 的 寄存 器 ,利用 中 断 返回 指令 
IRET 实现 中 断 返 回 。 由 于 它 是 内 部 中 断 处 理 程序 ,因此 在 结束 返回 之 前 ,不 需要 通知 中 断 控 
制 器 已 经 结束 处 理 。 

需要 指出 的 是 ,该 除法 出 错 中 断 处 理 程序 含有 一 条 特别 的 指令 “ADD WORD [BP 十 
18],，2”, 见 源 程序 *//@5” 行 。 这 条 指令 的 作用 是 ,调整 堆栈 中 的 中 断 返回 地 址 的 偏 移 ,使 得 
返回 地 址 偏 移 加 上 2。 这 样 做 的 原因 是 什么 ? 与 响应 外 部 中 断 不 同 ,CPU 在 响应 除法 出 错 中 
断 时 ,保存 的 返回 地 址 是 产生 除法 溢出 指令 的 地 址 ,也 即 引起 除法 出 错 中 断 的 指令 的 地 址 。 如 
果 不 调整 返回 地 址 ,那么 在 中 断 返 回 后 , 仍 将 执行 刚才 的 除法 指令 “DIV BL”, 如 此 会 陷入 无 
限 循 环 。 由 于 该 除法 指令 长 度 是 两 个 字 节 ,因此 返回 地 址 偏 移 加 2 之 后 ,返回 地 址 就 成 为 该 除 
法 指令 之 后 的 地 址 ,也 就 是 对 应 标号 LABYV 的 地 址 。 这 里 的 除法 出 错 中 断 处 理 程序 只 能 作为 
一 个 示例 ,不 能 用 于 处 理由 指令 长 度 超过 2 的 除法 指令 引起 的 除法 出 错 中 断 。 如 何 编写 一 个 
完善 的 除法 出 错 中 断 处 理 程序 , 留 为 作业 。 


8.4.3 扩展 显示 1/O 程序 


BIOS 和 操作 系统 的 例 行 子 程序 ,常常 以 中 断 处 理 程序 的 形式 存在 。 于 是 利用 中 断 指令 
“INT n” 能 够 方便 地 调用 这 些 例 行 子 程序 。 为 了 说 明 作为 例 行 子 程序 的 中 断 处 理 程序 的 设 
计 要 点 ,现在 来 看 一 个 扩展 的 显示 1/O 程序 。 

1. 示例 程序 

【 例 8-17】 设计 一 个 扩展 的 显示 1/O 程序 。 

它 以 90H 号 中 断 处 理 程序 的 形式 存在 ,其 功能 是 以 TTY 方式 显示 带 属 性 的 字符 。 表 7. 3 
所 列 显 示 1/O 程序 的 14 号 功能 虽然 是 以 TTY 方式 显示 字符 ,但 不 能 同时 指定 字符 的 属性 。 

演示 过 程 为 : 首先 工作 程序 设置 90H 号 中 断 向 量 ,使 其 指向 扩展 的 显示 1/O 程序 ; 然后 ， 
为 了 体现 演示 效果 ,循环 调用 这 个 例 程 显示 一 个 字符 串 ; 最 后 返回 加 载 器 。 

演示 程序 dp86. asm 的 源 代码 如 下 ,由 作为 90H 中 断 处 理 程序 的 扩展 显示 1/O 程序 和 演 
示 初 始 化 代码 两 部 分 组 成 : 

;演示 软件 中 断 处 理 程序 ( 采用 虚拟 机 可 加 载 格 式 ) 

















section text 
bits 16 
Signature db "YANG" ;签名 信息 
Version dn 1 ;格式 版 本 
Length dy end_of text ;工作 程序 长 度 
Start dy Begin ;工作 程序 入 口 点 的 偏 移 
Zoneseg dw 1A00H ;工作 程序 入 口 点 的 段 值 ( 期 望 ) 
Reserved dd 0 ;保留 
newhandler: ;扩展 显示 MO 程序 入口 
STI ; 开 中 断 Me 2 
PUSHA ;保护 通用 寄存 器 Ma 3 
PUSHDS ;保护 涉及 的 段 寄 存 器 M@4 
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Qin ;实现 功能 

Pep ES :恢复 段 寄存 器 

POP DS 

POPA :恢复 通用 寄存 器 

IRET :中断 返回 
putchar : 


;功能 : 当前 光标 位 置 处 显示 带 属 性 的 字符 ,随后 光标 后 移 一 个 位 置 
;人 口 : A= 字 符 AS0ll 码 ; B= 属性 
说 明 : 不 支持 退 格 符 、 响 铃 符 等 控制 符 


PUSHAX 
MX 俯 0B800H ;设置 显示 存储 区 段 值 
MX DS, MX 
MX ES 以 
POP A 
CAlL get lcursor ;取得 光标 逻辑 位 置 
QP AL OH ; 回 车 符 ? 
JZ .UB1 
MoD.0 是 , 列 号 pn=0 
JWP .LAB3 
.LAB1: 
OP AL OH ;换行 符 ? 
凤 .LAB2 
;至 此 ,普通 字符 
MX AH 有 BL :属性 
WBEX0 ;计算 光标 位 置 对 应 存储 单元 偏 移 
MX BL DH 
IMLBX, 80 
AD BL OL 
ADc 贞 0 
SLBX1 ;BE( 行 号 kB80r 列 号 ) * 2 
MX [EX], MX ; 写 到 显示 存储 区 对 应 单元 
INC DL ;增加 列 号 
PD ;超过 最 后 一 列 ? 
BB .LAB3 滞 
MV DL 0 是 , 列 号 =0 
.LAB2: 
IN DH ;增加 行 号 
OP mh 厂 ;超过 最 后 一 行 ? 
BB .LAB3 ; 否 


DEC DH 间 , 行 号 减 人 保持 在 最 后 一 行 ) 





aD ;实现 屏幕 向 上 滚 一 行 
MX SI, 80k 2 和 第 1 行 起 始 偏 移 
MO ES, x 
MX D1, 0 ;第 0 行 起 始 偏 移 
MNV CX gr 对 4 ;复制 2 行内 容 
REP NNVSN ;实现 屏幕 向 上 滚 一 行 
MO C 8 ;清除 屏幕 最 后 一 行 
MX DI, 80 24#* 2 瘟 后 一 行 起 始 偏 移 
MO 从 QO7D ; 黑 底 白字 
REP STOSN :形成 空白 行 
.LAB3: 
CAL set_ leursor ;设置 迎 辑 光标 
CALUL_set_pcursor ;设置 物理 光标 
FET 
get_lcursor: ;取得 逻辑 光标 位 置 ( 吴 行 号 ,DL= 列 号 ) 
PUSHDS 
PUSHOO4H ;BIOS 数据 区 的 段 值 是 004H 
POP DS ;DS= 0040H 
MX DL [ooaoH ;取得 列 号 
MOV DH [O051H] ;取得 行 号 
POP DS 
RET 
set_ loursor: ;设置 逻辑 光标 ( 吐 行 号 ,DL= 列 号 ) 
PUSHDS 
PUSHOO4H ;BIOS 数据 区 的 段 值 是 0040H 
POP DS :DS= 004H 
MO [O50H], DL ;设置 列 号 
MO [O051H], DH ;设置 行 号 
POP DS 
RET 
set_ poursor: ;设置 物理 光标 ( 吐 行 号 ,DL= 列 号 ) 
MO AL 8 ;计算 光标 寄存 器 值 
ML DH ;AE( 行 号 k80r 列 号 ) 
ADA., DL 
ACAO 
MW CAM ;保存 到 以 
MX 以 DH ;索引 端口 地 址 
MA, 人 4 ;4 号 是 光标 寄存 器 高 位 
OTDX A 
MN DX DEH 数据 端口 地 址 
MX AL OH 


OUT 以 A ;设置 光标 寄存 器 高 8 位 
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MV DX DH ;索引 端口 地 址 


MO DX, DEH 数据 端口 地 址 


OUT 以 AL ;设置 光标 寄存 器 低 8 位 


INT 10H ;指定 第 0 显示 页 


XR MX 以 准备 设置 中 断 向 量 


MO WORD [90Ht 4], nemhandler ;设置 9H 中 断 向 量 的 偏 移 
MO [oH 4+ 2], CS ;设置 9H 中 断 向 量 的 段 值 


MN SI, mess ;提示 信息 
MX BL 11H ; 蓝 底 白字 


RALA ;显示 信息 以 0 结尾 


INT 90H ;调用 扩展 的 显示 IO 功能 
;显示 带 属性 的 字符 


mess 中 " No.%H handler is ready. " , ah 0ah 0 

end_of_text: ;结束 位 置 

从 上 述 源 程序 可 知 ,作为 90H 号 中 断 处 理 程序 的 扩展 显示 1/O 程序 , 它 调用 子 程序 
putchar 完成 具体 功能 , 稍 后 具体 说 明子 程序 putchar。 

2. 软件 中 断 处 理 程序 设计 

由 中 断 指令 “INT n” 引 起 的 中 断 尽管 是 不 可 屏蔽 的 ,但 它 不 会 随机 发 生 , 只 有 在 CPU 执 
行 了 中 断 指令 后 , 才 会 发 生 。 所 以 ,中 断 指令 类 似 于 子 程序 调用 指令 ,相应 的 中 断 处 理 程序 在 
很 大 程度 上 类 似 于 子 程序 ,但 并 不 等 同 于 子 程序 。 把 这 样 的 中 断 处 理 程序 称 为 软件 中 断 处 理 
程序 。 软 件 中 断 处 理 程序 的 主要 步骤 如 下 。 

(1) 考虑 切换 堆栈 。 由 于 软件 中 断 处 理 程序 往往 在 开 中 断 状 态 下 执行 ,并 且 可 能 较 复杂 
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(可 能 占用 大 量 的 堆栈 空间 ) ,因此 应 该 考虑 切换 堆栈 。 切 换 堆栈 对 实现 中 断 骨 套 等 都 较为 
有 利 。 

(2) 及 时 开 中 断 。 开 中 断后 ,CPU 就 可 响应 可 屏蔽 的 外 设 中 断 请 求 ,或 者 说 使 外 设 中 断 
请 求 可 及 时 得 到 处 理 。 请 参见 上 述 dp85. asm 和 dp86. asm 中 源 程 序 “//@2” 行 。 但 是 ,如 果 
该 软件 中 断 程 序 会 被 外 设 中 断 处 理 程 序 * 调 用 ” ,那么 是 否 要 开 中 断 或 者 何 时 开 中 断 应 该 另外 
考虑 。 

(3) 应 该 保护 现场 。 应 该 保护 中 断 处 理 程序 要 重新 赋值 的 寄存 器 原 有 内 容 , 这 样 在 使 用 
中 断 指令 时 ,可 不 必 考 虑 有 关 寄 存 器 内 容 的 保护 问题 。 请 参见 上 述 dp85. asm 和 dp86. asm 中 
源 程序 “//@3” 和 “//@4” 行 。 

(4) 完成 中 断 处 理 。 但 不 必 过 分 追求 速度 上 的 高 效率 ,除非 它 是 被 外 设 中 断 处 理 程 序 “ 调 
用 ”的 。 

(5) 恢复 现场 。 依 次 恢复 被 保护 寄存 器 的 原 内 容 。 

(6) 堆栈 切换 。 如 果 在 开始 时 切换 了 堆栈 ,那么 也 在 要 重新 切换 回 原 堆栈 。 

(7) 一 般 利 用 IRET 指令 实现 中 断 返回 。 

内 部 中 断 是 由 执行 的 指令 引起 的 ,所 以 除法 出 错 中 断 处 理 程序 等 ,可 以 归 入 软件 中 断 处 理 
程序 这 一 类 别 。 

3. 显示 流程 

现在 来 看 子 程序 putchar 实现 TTY 方式 显示 带 属 性 字符 的 具体 流程 。 它 采用 直接 写 屏 
方式 在 当前 光标 位 置 处 实施 显示 操作 ,随即 移动 光标 到 下 一 个 显示 位 置 。 为 了 简化 ,没有 实现 
退 格 操作 和 响 铃 操作 等 功能 。 该 子 程序 的 实现 流程 如 图 8. 10 所 示 。 

在 7.3.3 节 介绍 了 直接 写 屏 显示 方式 ,也 即 把 字符 的 代码 和 属性 直接 填写 到 显示 存储 区 
中 相应 存储 单元 ,从 而 实现 显示 。 这 是 在 字符 显示 模式 下 ,实现 显示 的 最 终 操 作 方 式 。 

从 图 8. 10 可 知 ,在 显示 一 个 普通 字符 后 ,光标 列 号 增加 1, 表 示 移 动 到 当前 行 的 下 一 个 显 
示人 位置。 如 果 已 在 行 尾 ,那么 列 号 清 0, 行 号 增加 1 ,表示 移动 到 下 一 行 的 行 首 。 如 果 已 在 最 后 
一 行 , 那 么 屏幕 向 上 滚动 一 行 , 相 当 于 光标 移动 到 下 一 行 。 

从 子 程序 putchar 的 源 程 序 可 知 ,实现 屏幕 滚动 的 方法 是 移动 显示 存储 区 的 内 容 。 

4. 光标 位 置 

通常 由 光标 指示 屏幕 上 的 具体 操作 位 置 。 

在 BIOS 的 数据 区 ( 段 值 0040H) ,有 指定 的 存储 单元 保存 当前 光标 的 行列 坐标 值 。 这 个 
行列 坐标 值 被 称 为 光标 的 逻辑 位 置 。 可 以 简单 地 认为 ,光标 列 号 保存 在 偏 移 地 址 0050H 单 
元 ,光标 行 号 保存 在 偏 移 地 址 0051H 单元 。 访 问 BIOS 数据 区 的 这 两 个 单元 ,可 以 获取 或 者 
设置 当前 光标 的 逻辑 位 置 。 请 参见 dp86. asm 中 的 子 程序 get_lcursor 和 set_lcursor。 根 据 光 
标 位 置 的 行列 坐标 值 , 很 容易 计算 出 对 应 的 显示 存储 单元 地 址 。 

在 字符 显示 模式 下 ,屏幕 上 物理 光标 的 真正 显示 由 显示 控制 器 (接口 ) 中 的 光标 位 置 寄存 
器 决定 。 两 个 8 位 的 寄存 器 合并 成 16 位 ,决定 物理 光标 在 屏幕 上 的 具体 显示 位 置 。 这 个 光标 
位 置 寄存 器 的 16 位 值 被 称 为 光标 的 物理 位 置 。 系 统 给 显示 控制 器 分 配 了 一 组 端口 地 址 ,可 以 
简单 地 认为 ,通过 索引 端口 3D4H 和 数据 端口 3D5H 能 够 访问 光标 位 置 寄存 器 。 光 标 位 置 高 
8 位 寄存 器 的 地 址 是 14, 光 标 位 置 低 8 位 寄存 器 的 地 址 是 15。 请 参见 dp86. asm 中 的 子 程序 
set_pcursor。 它 设置 光标 物理 位 置 , 首 先 根据 二 维 的 逻辑 坐标 得 到 一 维 的 物理 地 址 ; 然后 设 
置 光 标 位 置 高 8 位 寄存 器 和 光标 位 置 低 8 位 寄存 器 ,实现 物理 光标 的 设置 。 
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图 8.10 简化 的 TTY 方式 显示 字符 流程 

















8.4.4 时 钟 显示 程序 


在 系统 加 电 初 始 化 期 间 ,把 系统 定时 器 初始 化 为 每 隔 约 55 毫秒 发 出 一 次 中 断 请 求 。 根 据 
图 8.8,CPU 在 响应 定时 中 断 请 求 后 转 入 8 号 定时 器 中 断 处 理 程序 。BIOS 提供 的 8 号 中 断 处 
理 程序 含有 一 条 中 断 指 令 *INT 1CH”, 所 以 每 秒 要 调用 到 约 18.2 次 1CH 号 中 断 处 理 程序 。 
实际 上 BIOS 的 1CH 号 中 断 处 理 程序 并 没有 做 任何 工作 ,可 以 认为 它 只 有 一 条 中 断 返 回 指 
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令 。 这 样 安排 的 目的 是 为 应 用 程序 留 下 一 个 软 接口 ,应 用 程序 只 要 提供 新 的 1CH 号 中 断 处 理 
程序 ,就 可 能 实现 某 些 周期 性 的 工作 。 

下 面 介绍 的 时 钟 显示 程序 就 是 利用 这 个 软 接口 ,实现 时 钟 显示 。 

【 例 8-18】 编写 一 个 实时 时 钟 显示 程序 。 

实现 思路 : 在 新 的 1CH 号 中 断 处 理 程序 中 安排 一 个 计数 器 ,记录 调用 它 的 次 数 , 当 计 数 
满 18 次 后 ,就 在 屏幕 的 中 间 位 置 显示 当前 的 时 间 ( 时 分 秒 ) ,并 且 重 新 设置 计数 器 初 值 。 于 是 
大 约 每 秒 显示 一 次 当前 时 间 。 通 过 读 取 RTC/CMOS RAM 获取 实时 时 钟 的 当前 时 间 值 。 

工作 程序 首先 保存 原 1CH 号 中 断 向 量 , 然 后 设置 新 的 1CH 号 中 断 向 量 。 为 了 体现 演示 
效果 ,随后 工作 程序 就 接收 并 显示 用 户 按键 ,直到 用 户 按 下 *# ”号 键 为 止 。 最 后 ,工作 程序 恢 
复原 1CH 号 中 断 向 量 ,并 返回 加 载 器 。 

时 钟 显 示 程 序 dp87. asm 如 下 : 


section text 

bits 16 
Signature db “YANG" ;签名 信息 
Version dw 1 ;格式 版 本 
Length dn end_of_text ;工作 程序 长 度 
Start dy Begin ;工作 程序 入 口 点 的 偏 移 
Zoneseg dn 2800H ;工作 程序 入 口 点 的 段 值 ( 期 望 ) 
Reserved dd 0 ;保留 


-新 的 10H 号 中 断 处 理 程序 


Entry_1CH: 
DEC BYIE [C8:cont] ;计数 器 减 1 
2 ETINE ; 当 计 数 为 0, 显 示 时 间 
IRET 否则 ,中 断 返回 
ETINE: 
MX BYTE [CS:cont], 18 淹 新 设置 计数 初 值 
ST ; 开 中 断 
PUSHA ;保护 现场 
CAl get_time ;获取 当前 时 间 
CALLEchoTime ;显示 当前 时 间 
POPA ;恢复 现场 
IRET ;中 断 返 回 
get_time: ;简化 方式 获取 实时 时 钟 ( 时 分 秒 ) 
MO AL 4 ;准备 读 取 时 值 
OUT TH 作 
IN AL 7IH ;获取 时 值 
MX CH 作 ;QF 时 值 BD 码 
MV AL 2 ;准备 读 取 分 值 
OUT TH 作 
IN AL 7IH ;获取 分 值 


WOA :0= 分 值 BD 码 
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MN SI, DX 


WA2 


准备 读 取 秒 值 


;时 间 显示 位 置 行 号 
;时 间 显示 位 置 列 号 
;显示 当前 时 间 ( 时 分 秒 ) 
;设置 显示 时 间 的 位 置 
;保存 人 口 参数 
;取得 当前 光标 位 置 


;保存 当前 光标 位 置 


;设置 光标 位 置 


;显示 当前 时 间 ( 时 :分 : 秒 ) 


;显示 时 值 


;显示 分 值 


;显示 秒 值 
恢复 光标 原先 位 置 


;显示 两 位 BD 码 值 





CALLPutChar 
FET 
PutChar: ;TY 方式 显示 一 个 字符 
MX BH 0 
WA 
INT 10H 
RET 
cont DB 1 ;计数 器 
oldith DD 0 ;用 于 保存 原 10H 号 中 断 向 量 
Begin: ;启动 点 
MX A CS 
WN DS, x ;DS= CS 
MX SI, 10Hr 4 ;OH 号 中 断 向 量 所 在 地 址 
MX 从 0 
MX ES, 俯 ;E=0 
;保存 1H 号 中 断 向 量 
MX 人 [ES:S 
MX [oldich], AX ;保存 向 量 的 偏 移 
MX AX [ES:Sl+ 习 
MN [oldicht 2], AX ;保存 向 量 的 段 值 
;设置 新 的 10H 号 中 断 向 量 
Ql ;关中 断 
MX 俯 Entry_10H 
MX [ES:S，A ;设置 新 向 量 的 偏 移 
WV AX CS 
MX [ES:SI+ 2], AX ;设置 新 向 量 的 段 值 
STI ; 开 中 断 
;等 待 并 接收 用 户 按键 ,直到 用 户 按 #' 键 ,结束 
Continue: 
MX Ah 0 
INT 16H ;等 待 并 接收 用 户 按键 
OP 人 L 2H 
JB Continue 
CALLPutChar 
OP AL " 哩 ' 
JNZ Continue ;只 要 不 是 ##, 继 续 等 待 并 接收 按键 
;恢复 原 10H 号 中 断 向 量 
MX EAX [CS:oldich] ;获取 保存 的 原 1H 号 中 断 向 量 


MN [ES:S，EAX :恢复 原 1H 号 中 断 向 量 


REF :结束 程序 ,返回 加 载 器 
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end_of_text: 源 程 序 结 束 位 置 

在 上 述 程序 中 ,为 了 简化 ,在 读 取 RTC/CMOS RAM 实时 时 钟 时 ,没有 判断 更 新 标志 位 。 
调用 BIOS 的 显示 1/O 程序 实现 时 钟 信息 的 显示 。 

在 工作 程序 设置 新 的 1CH 号 中 断 向 量 后 ,时 钟 就 开始 工作 。 值 得 注意 的 是 ,显示 时 钟 信 
息 子 程序 的 流程 : 首先 保存 当前 光标 位 置 ; 然后 定位 光标 到 指定 位 置 ; 接着 显示 时 钟 值 ; 最 
后 恢复 光标 原先 位 置 。 


习 题 


1. 什么 是 W/O 端口 地 址 ? IA-32 系列 CPU 的 1/O 端口 地 址 空间 有 多 大 ? 
2. 请 说 明 指令 “IN AX,， DX” 和 以 下 程序 片段 的 异同 。 

IN A 

in DX 

IN A 

WW 从 AL 
3. 请 说 明 指 令 “OUT 20H,AL” 和 以 下 程序 片段 的 异同 。 

WwW x 2H 

Or XA 
. CPU 与 外 设 之 间 交 换 的 信息 可 分 为 哪 几 类 ? 如 何 区 分 它们 ? 
.PC 及 其 兼容 机 常 采 用 哪些 方式 实现 输入 或 输出 ? 
. 简 述 查询 传送 方式 的 优 缺 点 。 请 画 出 一 般 查询 方式 的 实现 流程 图 。 
. 简 述 中 断 传 送 方式 及 其 优 缺 点 。 
. 什么 是 中 断 ? 什么 是 中 断 源 ? 
. 中 断 向 量 表 的 作用 是 什么 ?中 断 向 量 表 有 多 大 ?安排 在 哪里 ? 

10. 简 述 中 断 响应 的 过 程 。 

11. 中 断 返 回 指令 IRET 与 以 下 两 组 指令 有 何不 同 ? 

(1) REF 2 (2) REF 
POFF 

12. 如 何不 使 用 软 中 断 指 令 INT 调用 16H 号 中 断 处 理 程序 。 

13. 外 部 中 断 与 内 部 中 断 有 何 异 同 ? 举例 说 明 内 部 中 断 和 外 部 中 断 。 

14. 可 屏蔽 中 断 与 不 可 屏蔽 中 断 ( 非 屏 项 中 断 ) 有 何 异 同 ? 

15. 在 PC 系统 中 ,什么 条 件 下 才 会 响应 键盘 中 断 ? 如 何 使 得 系统 只 响应 键盘 中 断 , 而 不 
响应 其 他 外 设 中 断 ? 

16. 在 PC 系统 中 ,如 何 实现 中 断 优先 级 和 中 断 嵌 套 ? 

17. 设计 中 断 处 理 程序 时 应 该 遵循 哪些 原则 ? PC 系统 中 的 中 断 处 理 程序 通常 应 该 含有 
哪些 步骤 ? 

18. 请 编写 一 个 程序 显示 完整 的 中 断 向 量 表 。 

19. 请 编写 一 个 能 够 显示 某 个 中 断 向 量 的 程序 ,允许 用 户 指定 向 量 号 。 

20. 从 RTC/COMS RAM 中 可 获得 系统 当前 日 期 和 时 间 。 请 编写 一 个 程序 显示 RTC/ 
CMOS RAM 中 的 系统 当前 日 期 和 时 间 。 


oma 
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21. 请 编写 一 个 程序 在 屏幕 上 显示 系统 的 当前 时 间 , 当 用 户 按键 时 ,结束 程序 。 

22. 请 编写 一 个 程序 在 屏幕 中 心 位 置 显示 系统 的 当前 时 间 , 当 同时 按 下 左右 Shift 键 时 ， 
结束 程序 。 

23. 简 述 键盘 中 断 处 理 程序 .键盘 1/O 程序 和 键盘 缓冲 区 三 者 之 间 的 关系 。 这 样 安排 有 
何 优点 ? 

24. 通过 调整 BIOS 中 的 键盘 中 断 处 理 程序 ,可 使 到 所 按 的 大 写字 母 全 部 变换 为 对 应 的 小 
写字 母 。 编 写 一 个 测试 程序 验证 上 述 方法 。 

25. 通过 调整 BIOS 中 的 键盘 1/O 程序 ,可 使 到 所 按 的 大 写字 母 全 部 变换 为 对 应 的 小 写 
字母 。 编 写 一 个 测试 程序 验证 上 述 方法 。 

26. 通过 调整 BIOS 中 的 显示 1/O 程序 是 否 可 使 屏幕 上 只 显示 小 写字 母 ? 为 什么 ? 编写 
程序 测试 之 。 

27. 良好 的 除法 出 错 处 理 程序 应 该 可 以 终止 引起 出 错 故障 的 程序 ,请 编写 程序 验证 相关 
方法 。 

28. 编写 一 个 程序 验证 由 演示 程序 dp86. asm 支持 的 扩展 显示 功能 。 

29. 在 加 载运 行 演示 程序 dp84. asm( 支 持 新 的 键盘 中 断 处 理 ) 后 ,不 关闭 虚拟 机 ,尝试 运 
行 演示 程序 dp87. asm( 显 示 时 钟 ) ,请 观察 效果 。 然 后 ,请 改进 演示 程序 dp84. asm, 使 其 对 随 
后 其 他 程序 的 运行 没有 影响 。 

30. 请 谈 谈 汇编 语言 与 机 器 系统 的 关系 。 





保护 方式 程序 设计 


虽然 IA-32 系列 CPU 的 常态 工作 方式 是 保护 方式 ,但 前 面 各 章 介 绍 的 内 容 仅仅 是 32 位 
程序 设计 ,而 非 保护 方式 程序 设计 。 事 实 上 ,前 面 各 章 的 示例 程序 ,都 未 涉及 保护 机 制 。 

本 章 介绍 保护 方式 程序 设计 ,包括 分 段 存储 管理 机 制 、 分 页 存储 管理 机 制 , 特 权 级 变换 和 
任务 切换 ,还 包括 中 断 和 异常 的 处 理 。 这 部 分 内 容 属于 系统 程序 设计 范畴 ,考虑 到 篇 幅 , 做 了 
大 量 简 化 处 理 ,只 介绍 基本 内 容 。 

本 章 给 出 的 示例 程序 都 可 以 实际 运行 。 利 用 汇编 器 NASM, 可 以 由 源 代码 生成 纯 二 进 制 
目标 代码 。 这 些 示 例 程序 的 代码 包含 “工作 程序 特征 信息 ”, 利 用 7.4 节 介绍 的 加 载 器 ,可 以 加 
载运 行 它们 。 当 然 ,也 可 以 借助 虚拟 机 ,运行 这 些 示 例 程序 。 


9.1 概 述 


为 建立 多 任务 运行 环境 ,在 保护 方式 下 IA-32 系列 CPU 提供 全 方位 的 支持 。 支 持 分 段 和 
分 页 存储 管理 ,使 得 各 个 任务 能 够 拥有 独立 的 存储 空间 ,同时 共享 系统 级 的 代码 和 数据 。 支 持 
4 级 特权 设置 ,使 得 操作 系统 代码 和 应 用 程序 代码 能 够 在 不 同 特权 级 运行 ,从 而 实现 分 级 保 
护 。 此 外 ,还 支持 操作 系统 实现 虚拟 存储 器 ,甚至 实现 虚拟 机 。 


9.1.1 存储 器 管理 


1. 存储 单元 地 址 及 地 址 空间 

有 必要 先 明 确 关 于 存储 单元 地 址 的 多 个 概念 。 把 存储 单元 地 址 的 集合 称 为 地 址 空间 。 如 
2.4.1 节 所 述 , 把 表示 物理 存储 器 (内 存 ) 中 存储 单元 的 地 址 称 为 物理 地 址 ,物理 地 址 是 一 维 
的 。CPU 地 址 线 的 数量 决定 了 物理 地 址 的 位 数 ,也 决定 了 物理 地 址 空间 的 大 小 。 物 理 地 址 空 
间 只 有 一 个 。 通 常 , 在 PC 或 者 服务 器 系统 中 安装 的 物理 内 存 容量 小 于 物理 地 址 空间 的 容量 。 

如 2.4.2 节 所 述 , 把 程序 中 表示 存储 单元 的 地 址 称 为 逻辑 地 址 ,逻辑 地 址 是 二 维 的 。 事 实 
上 ,在 程序 中 采用 某 某 段 某 某 单元 的 方式 表示 存储 单元 。 在 保护 方式 下 ,多 辑 地 址 由 段 选择 子 
(Segment Selector) 和 偏 移 两 部 分 构成 。 第 一 维 的 段 选 择 子 给 定 某 某 段 ,第 二 维 的 偏 移 给 定 段 
内 的 位 置 。 每 个 任务 (程序 ) 有 自己 的 逻辑 地 址 空间 。 逻 辑 地 址 空间 的 大 小 取决 于 段 选择 子 的 
表示 和 偏 移 的 位 数 。 程 序 员 可 以 使 用 的 逻辑 地 址 空间 远 远大 于 客观 存在 的 物理 地 址 空间 。 有 
时 候 , 把 逻辑 地 址 空间 称 为 虚拟 地 址 空间 ,把 逻辑 地 址 称 为 虚拟 地 址 。 

所 谓 线 性 地 址 ,是 指 由 逻辑 地 址 转换 成 物理 地 址 过 程 中 得 到 的 一 维 地 址 。 线 性 地 址 空间 
的 大 小 取决 于 线性 地 址 的 长 度 (位 数 )。 可 以 认为 ,线性 地 址 空间 是 逻辑 地 址 空间 这 个 虚空 间 
到 物理 地 址 空间 这 个 实 空间 的 过 渡 。 
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2. 存储 地 址 空间 的 映射 

显然 ,只 有 在 物理 存储 器 中 的 代码 才能 运行 ,只 有 在 物理 存储 器 中 的 数据 才 可 访问 。 因 
此 ,逻辑 地 址 空间 必须 映射 到 物理 地 址 空间 ,二 维 的 逻辑 地 址 必须 转换 成 一 维 的 物理 地 址 。 

IA-32 系列 CPU 分 两 步 实现 逻辑 地 址 空间 到 物理 地 址 空间 的 映射 ,也 即 分 两 步 实现 逻 辑 
地 址 到 物理 地 址 的 转换 。 图 9. 1 是 地 址 映射 转换 的 示意 图 。 第 一 步 总 是 存在 的 。 由 分 段 存储 
管理 机 制 实现 逻辑 地 址 空间 到 线性 地 址 空间 的 映射 ,也 即 把 逻辑 地 址 转换 成 线性 地 址 。 第 二 
步 是 可 选 的 。 由 分 页 存储 管理 机 制 实现 线性 地 址 空间 到 物理 地 址 空间 的 映射 ,也 即 把 线性 地 
址 转换 成 物理 地 址 。 如 果 不 启 用 分 页 存储 管理 机 制 , 物 理 地 址 直接 等 于 线性 地 址 。 
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图 9.1 地 址 映射 转换 的 示意 图 


如 图 9. 1 所 示 ,线性 地 址 长 32 位 ,线性 地 址 空间 容量 为 4GB; 物理 地 址 长 32 位 ,物理 地 
址 空间 容量 也 是 4GB。 如 果 物 理 地 址 长 36 位 ,那么 物理 地 址 空间 将 达 64GB。 

3. 分 段 机 制 的 作用 

分 段 存储 管理 机 制 支持 根据 逻辑 需要 安排 程序 的 代码 段 .数据 段 和 堆栈 段 等 存储 段 (存储 
区 域 ;。 每 个 存储 段 可 作为 独立 的 单位 处 理 , 以 简化 存储 段 的 保护 及 共享 。 采用 称 为 描述 符 
(Descriptor) 的 数据 结构 来 描述 存储 段 的 起 始 位 置 有 效 范 围 和 存 取 属性 等 。 这 里 可 以 认为 ， 
上 述 多 辑 地 址 中 的 段 选择 子 是 对 应 描述 符 的 索引 ,由 它 给 定 存储 段 的 描述 符 , 从 而 给 定 存 
储 段 。 

基于 描述 符 ,不 仅 可 以 按 需 设置 存储 段 的 起 始 位 置 ,而 且 可 以 按 需 设置 存储 段 的 长 度 或 范 
围 ,最 大 可 以 达到 4GB。 这 样 能 够 准确 实施 存储 段 的 保护 隔离 ,防止 任务 内 或 者 任务 间 的 存 
储 段 交叉 重 释 。 基 于 描述 符 , 可 以 设 定 存 储 段 的 类 别 。 存 储 段 可 以 分 为 代码 段 . 数 据 段 和 系统 
段 等 类 别 。 这 样 能 够 严格 控制 对 不 同类 别 存储 段 的 访问 方式 ,防止 有 意 的 或 者 无 意 的 非法 存 
取 。 例 如 ,数据 段 只 能 读 ,或 者 既 可 读 又 可 写 。 又 如 ,代码 段 只 能 执行 ,或 者 既 可 执行 又 可 读 ， 
但 绝 不 能 写 。 基 于 描述 符 ,还 可 以 设 定 存储 段 的 访问 权限 。 这 样 能 够 有 效 阻止 应 用 程序 直接 
存 取 系 统 数据 ,防止 应 用 程序 侵入 操作 系统 。 

如 果 两 个 任务 使 用 同一 个 描述 符 , 那 么 能 够 共享 对 应 的 存储 段 。 

4. 分 页 机 制 的 作用 

为 了 建立 多 任务 运行 环境 ,操作 系统 应 该 实现 虚拟 存储 器 。 虚 拟 存储 器 是 一 种 软 硬 件 结 
合 的 技术 ,用 于 提供 比 在 计算 机 系统 中 实际 可 以 使 用 的 物理 内 存 大 得 多 的 虚拟 存储 空间 。 

分 页 存储 管理 机 制 支持 操作 系统 高 效 地 实现 虚拟 存储 器 。 分 页 存储 管理 机 制 把 线性 地 址 
空间 划分 为 尺寸 固定 的 块 ,这 样 的 块 称 为 页 (Page)。 把 物理 地 址 空间 也 划分 为 对 应 尺寸 的 
块 。IA-32 系列 CPU 最 初 只 支持 页 的 尺寸 为 4KB, 后 来 也 支持 4MB, 现 在 还 支持 2MB。 通 过 
建立 页 映射 表 ( 页 对 照 表 ) ,把 线性 地 址 空间 的 页 映射 到 物理 地 址 空间 的 页 ,实现 线性 地 址 到 物 
理 地 址 的 转换 。 支 持 按 需 分 配 物 理 页 ,可 以 根据 需要 建立 线性 页 到 物理 页 的 映射 关系 。 这 样 
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能 够 只 把 用 到 的 线性 页 映射 到 物理 页 , 换 句 话说 只 给 用 到 的 线性 页 分 配 物理 页 。 所 以 ,在 启用 
分 页 存储 管理 机 制 之 后 ,多 个 任务 的 线性 地 址 空间 可 以 映射 到 单一 的 物理 地 址 空间 ,确切 地 说 
映射 到 同一 物理 存储 器 (内 存 ) 。 

如 果 两 个 任务 使 用 相同 的 映射 表 项 ,那么 能 够 共享 对 应 的 物理 页 。 


9.1.2 特权 级 设置 


1. 四 级 特权 

综 上 所 述 ,通过 描述 符 和 页 映射 表 等 ,存储 管理 机 制 能 够 切实 保证 各 个 任务 所 属 存 储 段 的 
隔离 和 共享 ,但 前 提 是 不 能 随意 更 改 这 些 描述 符 和 页 映射 表 等 关键 数据 。 引 入 特权 级 就 是 为 
了 保证 只 有 高 级 别 的 程序 才能 修改 核心 数据 或 关键 数据 。 

IA-32 系列 CPU 支持 4 级 特权 设置 。 特 权 级 别 由 高 到 低 分 别 是 0、1、2 和 3, 数值 越 小 特 
权 级 别 越 高 ,权限 越 大 。 

图 9.2 示意 了 一 种 4 层 特权 级 别 的 使 用 安排 。 操 作 系 统 的 内 核 处 在 特权 级 0 层 ,具有 最 
高 级 别 ; 操作 系统 的 服务 程序 等 处 在 特权 级 1 和 2 层 ; 应 用 程序 处 在 特权 级 3 层 ,具有 最 低级 
别 。 这 样 安排 ,使 得 在 0 级 的 操作 系统 内 核能 够 访问 所 有 存储 段 ; 在 1 级 或 2 级 的 操作 系统 
服务 程序 能 够 访问 所 有 应 用 程序 的 存储 段 , 但 不 能 访问 位 于 0 级 的 操作 系统 内 核 ; 在 3 级 的 
应 用 程序 只 能 访问 程序 自身 的 存储 段 。 
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9.2 4 层 特权 级 别 设置 


为 了 避免 混淆 ,在 表示 特权 级 别 时 ,常常 使 用 “内 层 ” 表 示 较 高 特权 级 别 ; 使 用 “外 层 ” 表 示 
较 低 特权 级 别 。 最 内 层 是 最 高 特权 级 别 , 最 外 层 是 最 低 特权 级 别 。 

2. 特权 级 的 作用 

特权 级 用 于 限制 对 存储 段 的 访问 ,用 于 限制 对 特权 指令 的 执行 。 如 果 违 反 特权 保护 规则 
访问 存储 段 或 者 执行 特权 指令 ,将 引起 异常 。 

每 个 存储 段 都 有 一 个 特权 级 。 按 照 存 储 段 中 数据 的 重要 性 和 代码 的 可 信任 程度 ,指定 存 
储 段 的 特权 级 。 把 最 内 层级 分 配给 最 重要 的 数据 段 和 最 可 信任 的 代码 段 。 具 有 最 内 层级 的 数 
据 , 只 能 由 最 可 信任 的 代码 访问 。 给 不 重要 的 数据 段 和 普通 代码 段 分 配 外 层 的 特权 级 。 具 有 
最 外 层级 的 数据 ,可 被 任何 层级 的 代码 访问 。 图 9. 2 所 示 的 特权 级 使 用 安排 就 是 上 述 规则 的 
体现 。 

一 个 任务 总 是 在 某 个 特权 级 运行 ,当前 特权 级 (Current Privilege Level,CPL), 指 运行 时 
刻 的 特权 级 ,标记 为 CPL。 每 当 试 图 访问 一 个 数据 段 时 ,处 理 器 会 把 CPL 与 数据 段 的 特权 级 
进行 比较 ,以 决定 是 否 允 许 这 一 访问 。 以 CPL 执行 的 程序 ,允许 访问 同一 级 或 外 层级 的 数 





据 段 。 

外 层 的 程序 ,可 以 经 过 * 门 ?调用 内 层 的 服务 例 程 ( 子 程序 ) 。 通 过 这 种 途径 ,特权 级 由 
外 层 进 入 内 层 。 相 反 地 ,在 服务 例 程 结束 返回 时 ,特权 级 由 内 层 进 入 外 层 。 但 是 ,内 层 程序 
不 能 经 过 “ 门 ”调用 外 层 的 服务 例 程 ( 子 程序 ) ,当然 也 就 没有 外 层 服 务 例 程 返回 到 内 层 程序 
的 场景 。 

概括 地 说 ,内 层 程 序 可 以 访问 外 层 数 据 , 外 层 程 序 可 以 调用 内 层 服 务 例 程 。 

3. 任务 范围 

IA-32 系列 CPU 认为 一 个 任务 包括 应 用 程序 的 代码 和 数据 ,同时 也 包括 操作 系统 的 代码 
和 数据 。 换 句 话 说 ,任务 甲 由 应 用 程序 甲 和 操作 系统 构成 ,任务 乙 由 应 用 程序 乙 和 操作 系统 构 
成 。 任 务 甲 和 任务 乙 彼 此 独立 ,但 共享 操作 系统 ,图 9. 3 是 任务 范围 示意 图 。 
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图 9.3 任务 范围 示意 图 


综 上 所 述 ,属于 操作 系统 内 核 的 CodeKernel 可 访问 同 级 的 数据 段 DataKernel, 也 可 访问 
外 层 的 DataOS、DataAP1l 及 DataAP2 等 。 外 层 代 码 如 果 试 图 访问 内 层 的 存储 段 则 是 非法 的 ， 
将 引起 异常 。 如 图 9. 3 所 示 , CodeOS 可 访问 同 级 的 DataOS, 也 可 访问 外 层 的 DataAP1 和 
DataAP2 等 ,但 不 能 访问 内 层 的 DataKernel。 虽 然 应 用 程序 都 在 最 外 层 , 但 由 于 各 个 不 同 的 
应 用 程序 属于 不 同 的 任务 ,分 属 不 同 的 逻辑 地 址 空间 和 线性 地 址 空间 ,它们 被 隔离 保护 ,不 能 
互相 访问 。 如 图 9. 3 所 示 ,最 外 层 的 CodeAP1 只 能 访问 DataAP1 ,不 能 访问 同 级 的 男 一 个 应 
用 程序 的 DataAP2; 同样 ,CodeAP2 只 能 访问 DataAP2 ,不 能 访问 DataAP1 。 

综 上 所 述 , 较 外 层 的 CodeOS 可 以 调用 最 内 层 的 CodeKernel 提供 的 服务 ,最 外 层 的 
CodeAP1 可 以 调用 内 层 的 CodeOS 或 者 CodeKernel 提供 的 服务 ,最 外 层 的 CodeAP2 也 是 
如 此 。 


9.2 分 段 存储 管理 机 制 


分 段 存储 管理 机 制 是 实现 逻辑 地 址 到 物理 地 址 转换 的 基础 。 本 节 介 绍 保护 方式 下 的 分 段 
存储 管理 机 制 ,说 明 由 段 选择 子 和 偏 移 构成 的 二 维 逻辑 地 址 转换 为 一 维 线性 地 址 的 过 程 。 
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9.2.1 存储 段 


1. 存储 段 的 定义 

在 保护 方式 下 ,每 个 存储 段 由 段 基 地 址 (Base Address)、 段 界限 (Limit) 和 段 属性 
(Attributes) 三 项 要 素来 定义 。 

段 基 地 址 规定 一 个 段 在 线性 地 址 空间 中 的 起 始 地 址 。 在 保护 方式 下 , 段 基地 址 长 32 位 。 
一 个 段 可 以 从 线性 地 址 空间 中 的 任何 一 个 位 置 开 始 ,不 像 在 实 方式 下 段 的 起 始 地 址 必须 是 16 
的 倍数 。 但 是 ,如 果 段 的 基地 址 是 16 的 倍数 ,有 助 于 提高 存储 访问 的 效率 。 

段 界 限 规定 段 的 尺寸 。 段 界限 由 20 位 表示 ,而 且 段 界限 可 以 是 以 字 节 为 单位 或 以 4KB 
为 单位 。 段 属性 中 有 一 位 决定 段 界 限 的 粒度 , 称 该 位 为 粒度 位 ,用 符号 G 标记 。G=0 表示 段 
界限 以 字 节 为 单位 ,于 是 20 位 的 界限 可 表示 的 范围 是 1B 一 1MB, 增 量 为 1B; G==1 表示 段 界 
限 以 4KB 为 单位 ,于 是 20 位 的 界限 可 表示 的 范围 是 4KB~4GB, 增 量 为 4KB。 一 个 段 的 最 大 
长 度 可 以 达到 4GB, 而 非 实 方式 下 的 64KB。 

段 属性 规定 段 的 主要 特性 。 例 如 ,上 述 段 粒度 G 就 是 段 属性 的 一 部 分 。 在 访问 存储 段 
时 ,CPU 会 核查 访问 是 否 合法 ,核查 的 主要 依据 是 段 属 性 。 例 如 ,如 果 向 一 个 只 读 段 进行 写 人 
操作 ,那么 不 仅 不 写 信 ,而且 会 引起 异常 。 下 一 节 将 详细 说 明 段 属性 各 位 的 定义 和 作用 。 

2. 逻辑 空间 到 线性 空间 的 映射 

段 基地 址 和 段 界限 规定 了 段 所 映射 的 线性 地 址 的 范围 。 段 基地 址 Base 是 线性 地 址 对 应 
于 段 内 偏 移 为 0 的 逻辑 地 址 , 段 内 偏 移 为 x 的 逻辑 地 址 对 应 Base 十 x 的 线性 地 址 。 在 某 个 段 
内 从 偏 移 0 到 Limit 范围 内 的 逻辑 地 址 对 应 于 从 Base 到 Base 十 Limit 范围 内 的 线性 地 址 。 

由 逻辑 地 址 空间 映射 到 线性 地 址 空间 的 存储 段 , 彼 此 可 以 相对 分 离 互相 连接 、 部 分 重 释 、 
完全 重 释 、 完 全 包含 。 图 9. 4 示意 了 一 个 段 从 逻辑 地 址 空间 映射 到 线性 地 址 空间 的 情形 。 
图 9. 4 中 BaseA 等 代表 段 基 地 址 ,LimitA 等 代表 段 界 限 , 段 A 和 段 C 部 分 重生 。 
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图 9.4 地 址 空间 映射 示意 图 


3. 平展 方式 
综 上 所 述 , 段 的 基地 址 可 以 是 0, 并 且 段 的 长 度 可 以 达到 4GB。 因 此 最 简单 的 分 段 存储 管 
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理 是 把 整个 线性 空间 作为 一 个 段 ,也 即 段 的 基地 址 是 0, 段 的 界限 是 FFFFFFFFH。 逻 辑 上 仍 
然 有 代码 段 、 数 据 段 和 堆栈 段 ,依靠 段 的 属性 来 加 以 区 分 ,但 它们 统一 映射 到 完整 的 线性 地 址 
空间 。 把 这 种 分 段 存储 管理 方式 称 为 基本 平展 方式 。 


9.2.2 存储 段 描 述 符 


把 用 于 表示 段 基地 址 、 段 界限 和 段 属性 的 数据 结构 称 为 描述 符 。 每 个 描述 符 长 8B。 每 一 
个 段 都 有 一 个 相应 的 描述 符 来 描述 。 

按 描 述 符 所 描述 的 对 象 分 类 ,描述 符 可 分 为 存储 段 描 述 符 、 系 统 段 描述 符 和 门 描述 符 ( 控 
制 描述 符 ) 三 类 。 

1. 存储 段 描述 符 

存储 段 指 存 放 程序 代码 和 数据 的 区 域 。 存 储 段 描 述 符 描述 存储 段 ,也 就 是 代码 段 或 数据 
段 ,所 以 存储 段 描述 符 也 被 称 为 代码 和 数据 段 描述 符 。 

存储 段 描述 符 的 格式 如 图 9. 5 所 示 。 图 中 上 面 一 排 是 对 描述 符 8B 的 使 用 说 明 , 最 低地 
址 字 节 (假设 地 址 为 m) 在 最 右边 ,其 余 字 节 依 次 向 左 ,直到 最 高 字 节 ,地 址 为 m 十 7; 下 一 排 是 
对 属性 字段 各 位 的 说 明 。 
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图 9.5 存储 段 描述 符 的 格式 


从 图 9.5 可 知 ,长 32 位 的 段 基 地 址 (起 始 地 址 被 安排 在 描述 符 的 两 个 域 中 ,其 位 0 至 位 
23 被 安排 在 描述 符 内 的 第 2 至 第 4 字 节 中 ,其 位 24 至 位 31 被 安排 在 描述 符 内 的 第 7 字 节 中 。 
长 20 位 的 段 界限 也 被 安排 在 描述 符 的 两 个 域 中 ,其 位 0 至 位 15 被 安排 在 描述 符 内 的 第 0 至 
第 1 字 节 中 ,其 位 16 至 位 19 被 安排 在 描述 符 内 的 第 6 字 节 的 低 4 位 中 。 这 样 的 安排 ,与 早先 
的 Intel 80286 处 理 器 有 关 。 

描述 符 中 的 段 属性 也 被 安排 在 两 个 域 中 。 下 面 对 其 定义 及 意义 作 说 明 。 

(1) P 位 是 段 存 在 (Present) 位 。P=1 表示 描述 符 所 描述 的 段 存 在 ,描述 符 有 效 ; P=0 表 
示 段 不 存在 ,描述 符 对 地 址 转换 无 效 。 引 用 无 效 的 描述 符 会 引起 异常 。 

(2) DPL 表示 描述 符 特权 级 (Descriptor Privilege Level) , 共 两 位 。 它 规定 了 所 描述 存储 
段 的 特权 级 ,用 于 特权 核查 ,以 决定 对 该 段 能 否 进行 访问 。 

(3) S 位 是 描述 符 类 型 位 。S=1 表示 该 描述 符 是 存储 段 描述 符 ; S 二 0 表示 该 描述 符 是 系 
统 段 描述 符 或 者 门 描述 符 。 在 9.6 节 具 体 介 绍 系统 段 描述 符 和 门 描述 符 。 

(4) TYPE 说 明 所 描述 的 存储 段 的 具体 类 型 。TYPE 占用 4 个 位 ,总 共 可 以 表示 16 种 类 
型 , 表 9.1 列 出 了 存储 段 的 这 16 种 类 型 。 
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表 9.1 存储 段 的 具体 类 型 

















类 型 值 说 明 类 型 值 说 明 
0 只 读 8 只 执行 、 非 一 致 代码 段 
1 只 读 , 已 访问 a 只 执行 、 非 一 致 代码 段 ,已 访问 
2 读 / 写 A 执行 / 读 、 非 一 致 代码 段 
3 读 / 写 ,已 访问 B 执行 / 读 、 非 一 致 代码 段 ,已 访问 
4 只 读 、 向 低 扩展 C 只 执行 一致 代码 段 
5 只 读 、 向 低 扩展 ,已 访问 D 只 执行 一 致 代码 段 , 已 访问 
6 读 / 写 .向 低 扩展 E 执行 / 读 、 一 致 代码 段 
7 读 / 写 .向 低 扩 展 ,已 访问 3 执行 / 读 、 一 致 代码 段 ,已 访问 


从 表 9. 1 可 见 ,类 型 值 小 于 8 的 存储 段 是 数据 段 , 大 于 等 于 8 的 存储 段 是 代码 段 。 事 实 
上 ,TYPE 的 最 高 位 (位 3) 用 于 区 分 存储 段 是 数据 段 还 是 代码 段 。 对 于 数据 段 ,又 分 成 只 读 或 
者 是 可 读 可 写 。 对 于 代码 段 , 又 分 成 只 能 执行 ,或 者 是 既 可 执行 又 可 以 读 。 

类 型 值 是 奇数 ,表示 存储 段 已 经 被 访问 过 。TYPE 的 位 0 是 A 位 (Accessed) ,在 把 指示 
描述 符 的 段 选 择 子 装 入 到 段 寄存 器 时 ,CPU 将 设置 TYPE 中 的 A 位 ,表明 该 描述 符 已 被 访 
问 。 操 作 系统 通过 测试 A 位 ,可 以 判断 描述 符 是 否 被 访问 过 ,进而 推断 对 应 的 存储 段 是 否 被 
访问 过 。 

对 于 数据 段 ,有 扩展 方向 的 区 分 。TYPE 的 位 2 是 E 位 (Expansion-direction) ,决定 扩展 
方向 。 数 据 段 的 扩展 方向 和 段 界限 一 起 决定 了 数据 段 内 偏 移 的 有 效 范 围 。 对 于 普通 数据 段 ， 
通过 增加 段 界限 ,可 以 使 得 段 的 容量 得 到 扩展 。 但 是 对 于 堆栈 段 ,情形 刚好 相反 ,因为 堆栈 的 
底 在 高 地 址 端 , 随 着 压 栈 操作 ,堆栈 将 向 低地 址 方向 扩展 ,所 以 需要 区 分 扩展 方向 。 向 低 扩展 
的 数据 段 主要 用 于 堆栈 段 。 对 于 向 低 扩 展 的 数据 段 , 段 内 偏 移 必须 大 于 段 界 限 。 

对 于 代码 段 , 有 非 一 致 代 码 段 和 一 致 代 码 段 的 区 分 。TYPE 的 位 2 是 C 位 
(Conforming) ,决定 是 否 是 一 致 代码 段 ; C=0 表示 非 一 致 代码 段 ; C= 二 1 表示 一 致 代码 段 。 在 
9.7 节 将 进一步 说 明 一 致 代码 段 的 作用 。 

(5) G 位 就 是 段 界限 粒度 (Granularity) 位 。G 二 0 表示 段 界限 粒度 是 字 节 ; G 二 1 表示 段 
界限 粒度 是 4KB。 注 意 ,界限 粒度 只 对 段 界限 有 效 , 对 段 基 地 址 无 效 , 段 基地 址 总 是 以 字 节 为 
单位 。 

(6) D/B 位 是 一 个 很 特殊 的 位 ,在 描述 可 执行 代码 段 、 堆 栈 段 或 者 向 低 扩展 数据 段 的 3 种 
描述 符 中 ,其 意义 并 不 相同 。 

在 描述 代码 段 的 描述 符 中 ,作为 D 位 决定 代码 段 的 模式 。D=1 表示 32 位 代码 段 , 缺 省 
情况 下 指令 使 用 32 位 地 址 及 32 位 或 8 位 操作 数 ; D=0 表示 16 位 代码 段 , 缺 省 情况 下 使 用 
16 位 地 址 及 16 位 或 8 位 操作 数 。 由 此 可 知 ,IA-32 系列 CPU 支持 32 位 代码 段 和 16 位 代码 
段 两 种 段 模式 。 在 6. 6 节 介 绍 过 ,利用 汇编 器 NASM 提供 的 段 模 式 声明 语句 BITS, 可 以 声明 
汇编 源 程序 采用 的 段 模式 。 顺 便 提 一 下 ,在 一 条 指令 中 利用 地 址 大 小 前 级 能 够 改变 缺 省 的 地 
址 尺寸 ,利用 操作 数 大 小 前 级 能 够 改变 缺 省 的 操作 数 尺寸 。 

在 描述 堆栈 段 的 描述 符 中 ,作为 B 位 决定 堆栈 操作 所 使 用 的 堆栈 指针 寄存 器 。B=1 表示 
使 用 32 位 堆栈 指针 寄存 器 ESP; B 一 0 表示 使 用 16 位 堆栈 指针 寄存 器 SP。 所 谓 堆栈 段 是 指 
由 段 寄 存 器 SS 指示 的 段 , 也 即 形成 线性 地 址 时 引用 SS 寄存 器 。 

在 描述 向 低 扩 展 数据 段 的 描述 符 中 ,作为 B 位 决定 段 的 上 部 边界 。B=1 表示 段 的 上 部 界 
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限 为 FFFFFFFFH; B==0 表示 段 的 上 部 界限 为 FFFFH。 

(7) AVL 位 是 软件 可 利用 位 。CPU 对 该 位 的 使 用 未 做 规定 ,Intel 公司 保证 ,今后 兼容 的 
CPU 对 该 位 的 使 用 不 做 任何 定义 或 规定 。 

此 外 ,描述 符 内 第 6 字 节 中 的 位 5 须 置 为 0, 可 理解 成 为 以 后 的 发 展 所 保留 。 事 实 上 ,在 
Intel 的 64 位 CPU 中 ,该 位 为 1 表示 64 位 段 。 

2. 存储 段 描述 符 宏 的 声明 

按 图 9. 5 给 出 的 存储 段 描述 符 的 格式 ,基于 汇编 器 NASM, 可 采用 如 下 形式 声明 一 个 宏 ， 
以 表示 描述 符 结构 。 

%macro DESORIPTOR 5 


.LIMT DW %1 : 段 界 限 ( 0 区 
.BASE DW %2 北 基 地 址 (0 僻 
.BASBM DB %3 : 段 基 地 址 ( 16 23) 
ATRI DW %4 逆 属 性 

.BASEH DB %5 : 段 基地 址 (2 30) 
% endmacro 


利用 上 面 的 宏 DESCRIPTOR ,在 汇编 语言 源 程序 中 可 以 方便 地 定义 描述 符 。 
【 例 9-1】 如 下 描述 符 CODE 描述 一 个 只 可 执行 的 32 位 代码 段 , 段 基地 址 是 
12345678H ,以 字 节 为 单位 的 界限 是 OFFFH ,描述 符 特权 级 DPL=0。 
OODE DESCRIPTR GOFFFH 568H 34 40p8H 1 
在 如 上 定义 描述 符 CODE 之 后 ,可 以 采用 如 下 形式 访问 描述 符 中 的 有 关 字 段 , 这 与 汇编 
器 NASM 中 的 标号 表示 有 关 。 
MN [OEBASE], AMX 
MV [OoDEBASEM], DL 
【 例 9-2〗 如 下 描述 符 VideoMem 描述 一 个 可 读 写 的 数据 段 , 基 地 址 是 0B8000H ,以 字 节 
为 单位 的 界限 是 1999 ,描述 符 特权 级 DPL=3。 
Videolem DESCRIPTOR 1999, 8000H (EH, OFXH 0 


9.2.3 全 局 和 局 部 描述 符 表 


一 个 任务 会 涉及 多 个 段 ,每 一 个 段 至 少 需要 有 一 个 描述 符 来 描述 ,为 了 便于 组 织 管理 ,IA-32 
系列 CPU 把 描述 符 组 织 成 线性 表 。 由 描述 符 组 成 的 线性 表 称 为 描述 符 表 。 它 有 3 种 类 型 的 
描述 符 表 : 全 局 描述 符 表 (Global Descriptor Table, GDT)、 局 部 描述 符 表 (Local Descriptor 
Table,LDT) 和 中 断 描述 符 表 (Interrupt Descriptor Table,IDT) 。 在 整个 系统 中 ,只 有 一 张 全 
局 描述 符 表 GDT, 只 有 一 张 中 断 描述 符 表 IDT, 而 每 个 任务 可 以 有 一 张 属于 自己 的 局 部 描述 


符 表 LDT。 
【 例 9-3〗 如 下 所 列 描述 符 表 含 有 6 个 描述 符 。 
Dmy DESRIPIR 00000 ; 哑 描 述 符 
Nomal DESCRIPTIOR OFFFFH 0 0 00p2H 0 :可 读 写 数据 段 , 长 4B 
Code16 。” DESCRIPTOR FFH 1230H 2 008H 0 ;6 位 代码 段 ,长 3B 
Code32 DESCRIPIOR FFH 1A30H 2 40p8H 0 溉 位 代码 段 ,基地 址 21A30H 


StackS DESCRIPTOR 1FFH 1E30H 2 0%3H.0 沁 访 问 可 读 写 数据 段 


第 9 章 保护 方式 程序 设计 “349 





Data$ DESCRIPTOR OFH OFFFOH OFFH O090H OFFH ;只 读数 据 段 ,长 16 字 节 

每 个 描述 符 表 自 身 形成 一 个 特殊 的 数据 段 。 这 样 的 特殊 数据 段 最 多 可 以 含有 8K(8096) 
个 描述 符 。 

每 个 任务 的 局 部 描述 符 表 LDT 含有 该 任务 自己 的 代码 段 、 数 据 段 和 堆栈 段 的 描述 符 , 也 
包含 该 任务 所 使 用 的 一 些 门 描述 符 。 随 着 任务 的 切换 ,系统 当前 的 局 部 描述 符 表 LDT 也 将 
随 之 切换 。 

全 局 描述 符 表 GDT 含有 每 一 个 任务 都 可 能 或 可 以 使 用 的 描述 符 。 它 不 仅 包 含 操作 系统 
所 使 用 的 代码 段 、 数 据 段 和 堆栈 段 的 描述 符 , 而 且 也 包含 系统 所 使 用 的 多 种 特殊 数据 段 的 描述 
符 , 如 描述 某 个 任务 LDT 表 的 描述 符 等 。 在 任务 切换 时 ,并 不 切换 GDT 表 。 

利用 LDT 表 可 以 使 得 属于 某 个 任务 私有 的 各 个 存储 段 与 其 他 任务 相隔 离 , 从 而 达到 保 
护 的 目的 。 通 过 GDT 表 可 以 使 得 各 个 任务 都 需要 使 用 的 存储 段 能 够 被 共享 。 图 9. 6 示意 了 
任务 A 和 任务 也 所 涉及 的 这 些 段 既 隔离 保护 ,又 合用 共享 的 情况 。 利 用 任务 A 的 局 部 描述 符 
表 LdtA 和 任务 B 的 局 部 描述 符 表 LdtB, 把 任务 A 所 私有 的 代码 段 CodeA 及 数据 段 DataA 
与 任务 B 所 私有 的 代码 段 CodeB 和 数据 段 DataB 及 DataB2 隔离 ,但 任务 A 和 任务 B 通过 全 
局 描述 符 表 GDT 共享 代码 段 CodeK 及 CodeOS 和 数据 段 DataK 及 DataOS。 


LDTA GDT LDTB 
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任务 A 任务 B 
图 9.6 全 局 和 局 部 描述 符 表 的 分 工 


9.2.4 ”上 段 选 择 子 


如 2.4 节 所 述 ,二 维 的 逻辑 地 址 表示 为 “ 段 号 : 偏 移 ”的 形式 。 在 实地 址 方式 下 ,其 段 号 是 
段 值 ; 在 保护 方式 下 ,其 段 号 则 是 段 选择 子 。 
段 选择 子 长 16 位 ,其 格式 如 图 9. 7 所 示 。 常 常 把 段 选择 子 简称 为 选择 子 。 从 图 9. 7 可 
15 3 210 
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描述 符 索引 1 | RPL 

















图 9.7 段 选 择 子 的 格式 


新 概念 汇编 语言 





见 ,选择 子 的 高 13 位 是 描述 符 索 引 (Index)。 所 谓 描述 符 索 引 是 指 描述 符 在 描述 符 表 中 的 序 
号 。 选 择 子 的 第 2 位 是 引用 描述 符 表 指 示 位 ,标记 为 TI(Table Indicator) ,TI 二 0 指示 从 全 局 
描述 符 表 GDT 中 取得 描述 符 ; TI=1 指示 从 局 部 描述 符 表 LDT 中 取得 描述 符 。 

段 选择 子 给 定 段 描述 符 , 段 描述 符 给 定 段 基地 址 , 段 基 地 址 与 偏 移 之 和 就 是 线性 地 址 。 逻 
辑 地 址 空间 中 由 段 选择 子 和 偏 移 两 部 分 构成 的 二 维 逻 辑 地 址 ,就 是 这 样 确定 线性 地 址 空间 中 
的 一 维 线性 地 址 。 

段 选择 子 的 最 低 两 位 是 请 求 特权 级 (Requested Privilege Level,RPL) ,用 于 特权 检测 。 在 
9.7 节 ,将 进一步 说 明 RPL 的 作用 。 

【 例 9-4】〗 假设 某 个 选择 子 的 内 容 是 0020H。 根 据 图 9. 7 所 示 段 选择 子 的 格式 可 知 ， 
Index 二 4,TI 二 0,RPL 二 0, 所 以 它 指定 全 局 描述 符 表 中 的 第 4 个 描述 符 , 请 求 特权 级 是 0。 

【 例 9-5】 假设 某 个 选择 子 的 Index=5,TI=1,RPL=3, 那 么 该 段 选 择 子 的 内 容 是 2FH。 

由 于 段 选择 子 中 的 描述 符 索引 字段 用 13 位 表示 ,所 以 可 区 分 8096 个 描述 符 。 这 也 就 是 
描述 符 表 最 多 含有 8096 个 描述 符 的 原因 。 由 于 每 个 描述 符 长 8 字 节 ,按照 图 9.7 所 示 段 选择 
子 的 格式 ,屏蔽 段 选择 子 的 低 3 位 后 所 得 值 就 是 段 选择 子 所 指定 的 描述 符 在 描述 符 表 中 的 偏 
移 , 这 应 该 是 安排 段 选择 子 高 13 位 为 描述 符 索 引 的 原因 。 

有 一 个 特殊 的 空 (Null) 选 择 子 , 它 的 Index=0,TI=0, 而 RPL 字段 可 以 为 任意 值 。 空 选 
择 子 有 特定 的 用 途 , 当 用 空 选择 子 进行 存储 器 访问 时 会 引起 异常 。 空 选择 子 是 特别 定义 的 , 它 
不 对 应 于 全 局 描述 符 表 GDT 中 的 第 0 个 描述 符 , 因 此 GDT 中 的 第 0 个 描述 符 总 不 会 被 处 理 
器 访问 ,一 般 把 它 置 成 全 0。 但 当 TI=1 时 ,Index 为 0 的 选择 子 不 是 空 选择 子 , 它 指定 局 部 描 
述 符 表 LDT 中 的 第 0 个 描述 符 。 


9.2.5 逻辑 地 址 到 线性 地 址 的 转换 


1. 描述 符 高 速 缓冲 存储 器 

在 实 方式 下 , 段 寄存 器 含有 段 值 ,在 由 逻辑 地 址 形成 物理 地 址 时 ,CPU 引用 相应 的 某 个 段 
寄存 器 得 到 段 值 。 在 保护 方式 下 , 段 寄 存 器 含有 段 选择 子 , 当 由 逻辑 地 址 形成 线性 地 址 时 ， 
CPU 要 使 用 段 选择 子 所 指定 的 描述 符 中 的 段 基地 址 和 段 界 限 等 信息 。 

为 了 避免 在 每 次 存储 器 访问 时 ,都 要 通过 访问 内 存 中 的 描述 符 表 而 获得 对 应 段 描 述 符 , 每 
个 段 寄 存 器 都 配 有 一 个 高 速 缓 冲 存储 器 , 称 为 描述 符 高 速 缓冲 存储 器 或 称 为 描述 符 投影 寄存 
器 ,对 程序 员 而 言 它 是 隐藏 的 。 当 把 一 个 段 选择 子 装 入 到 某 个 段 寄存 器 时 ,CPU 自动 从 描述 
符 表 中 取出 相应 的 描述 符 ,并 把 描述 符 中 的 信息 保存 到 对 应 的 高 速 缓冲 存储 器 中 。 在 此 之 后 ， 
在 访问 对 应 存储 段 时 ,CPU 都 使 用 对 应 高 速 缓冲 存储 器 中 的 描述 符 信 息 , 而 不 用 再 从 描述 符 
表 中 取出 描述 符 。 段 描述 符 高 速 缓冲 存储 器 内 保存 的 描述 符 信息 将 一 直 保 持 , 直 到 重新 把 段 
选择 子 装载 到 段 寄存 器 时 为 止 。 

每 个 段 描述 符 高 速 缓冲 存储 器 中 保存 有 对 应 段 的 基地 址 .界限 和 存 取 属性 信息 。 其 中 ,32 
位 段 基 地 址 直接 取 自 描述 符 ,32 位 段 界限 取 自 描述 符 中 的 段 界 限 ,并 转换 成 字 节 为 单位 。 

2. 地 址 转换 

如 前 所 述 , 在 保护 方式 下 ,二 维 逻 辑 地 址 的 第 一 维 是 段 选 择 子 , 第 二 维 是 偏 移 。 段 选择 子 
决定 段 描 述 符 , 段 描述 符 含有 有 段 基地 址 ,所 以 段 选 择 子 决定 了 段 基地 址 。 

线性 地 址 等 于 段 基地 址 加 上 偏 移 。 图 9. 8 示意 了 利用 描述 符 高 速 缓冲 存储 器 实现 由 逻辑 
地 址 到 线性 地 址 的 转换 过 程 。 在 把 段 选 择 子 加 载 到 段 寄 存 器 的 同时 ,包含 段 基地 址 的 描述 符 
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信息 被 加 载 到 描述 符 高 速 缓冲 存储 器 中 。 随 后 ,把 32 位 段 内 偏 移 加 上 高 速 存储 器 中 的 32 位 
段 基 地 址 就 能 够 得 到 32 位 线性 地 址 。 在 不 启用 分 页 存储 管理 机 制 时 ,所 得 到 的 线性 地 址 就 是 
物理 地 址 。 


可 以 认为 ,访问 存储 器 时 必定 使 用 到 某 个 段 寄 存 器 ,包括 段 基地 址 在 内 的 描述 符 信息 已 经 


先行 被 装 和 人 CPU 内 部 的 描述 符 高 速 缓冲 存储 器 ,所 以 存储 器 存 取 性 能 不 会 受 影 响 。 
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9.8 高速 缓冲 存储 器 用 于 逻辑 地 址 到 线性 地 址 转换 


【 例 9-6】 假设 有 如 下 全 局 描述 符 表 GDT。 
Dumy DESRIPIR 00000 ; 哑 描 述 符 
Code DESCRIPIR FHA456H 1,9H0 ;基地 址 1456H, 长 2048, 代码 段 
DataA 。 DESCRIPTOR 1FFH 1230H 29H0 ;基地 址 21230H, 长 512, 读 写 数 据 段 
DataB DESCRIPIR 。 200H 3000H 0.9H0 ;基地 址 09000, 长 513, 只 读数 据 段 
在 做 好 其 他 相关 准备 后 ,执行 如 下 指令 片段 : 
MW AX 10H ;选择 子 中 TE 0,RR=0 
MV DSM ;把 选择 子 装 入 段 寄 存 器 只 
将 把 可 读 写 数据 段 DataA 的 描述 符 信息 装 入 到 有 段 寄存 器 DS 的 高 速 缓冲 存储 器 中 , 段 基 


地 址 是 00021230H , 段 长 是 512 字 节 。 


随后 ,执行 如 下 指令 将 把 线性 地 址 为 000213A8H 的 存储 单元 ( 双 字 ) 读 取 到 寄存 器 EDX: 
WW EX [oadl 

执行 如 下 指令 ,将 把 寄存 器 CL 的 内 容 写 到 线性 地 址 为 00021253H 的 存储 单元 : 
MV [oH], Qo 

3. 保护 检测 

在 加 载 段 寄存 器 时 ,CPU 会 进行 保护 检测 。 在 9.7. 1 节 将 作 进一步 说 明 。 

在 存 取 存储 单元 时 ,CPU 会 根据 描述 符 高 速 缓冲 存储 器 中 的 信息 检测 是 否 违反 保护 规 


。 违 反 保护 规则 的 行为 ,将 导致 异常 。 在 9. 8 节 将 介绍 相关 异常 及 其 处 理 。 


【 例 9-7】 假设 基于 例 6 的 全 局 描述 符 表 GDT ,在 做 好 相关 准备 后 ,执行 如 下 指令 片段 : 
MV A 人 ;选择 子 中 TF 0,RR=0 





WwW ESM :把 选择 子 装 和 人 段 寄存 器 外 
那么 将 把 只 读数 据 段 DataB 的 描述 符 信 息 装 和 人 到 段 寄 存 器 ES 的 高 速 缓冲 存储 器 中 , 段 
基地 址 是 00030000H , 段 长 是 513 字 节 。 
随后 ,如 果 执 行 如 下 指令 ,将 因为 存储 单元 地 址 越界 引起 异常 。 
MY EX [ES:0258H] 
如 果 执 行 如 下 指令 ,将 因为 向 只 读 的 存储 段 进行 写 操作 而 引起 异常 。 
MV [ES:ap3, AL 


9.3 存储 管理 寄存 器 和 控制 寄存 器 


在 保护 方式 下 ,CPU 运行 有 多 个 选项 ,存储 管理 较为 复杂 ,为 此 IA-32 系列 CPU 有 一 组 
寄存 器 用 于 存储 管理 ,有 一 组 寄存 器 用 于 系统 控制 。 本 节 简 要 介绍 存储 管理 寄存 器 ,简要 说 明 
控制 寄存 器 ,还 简要 介绍 相关 存 取 指令 。 


9.3.1 存储 管理 寄存 器 


1. 关于 存储 管理 寄存 器 

全 局 描述 符 表 GDT、 局 部 描述 符 表 LDT 和 中 断 描 述 符 表 IDT 等 是 非常 重要 的 特殊 段 ， 

它们 含有 分 段 存储 管理 机 制 所 用 到 的 重要 表格 (系统 表 和 系统 段 )。 为 了 方便 快速 地 定位 这 些 

特殊 段 ,CPU 利用 专门 寄存 器 保存 这 些 段 的 基地 址 和 界限 等 信息 ,如 图 9.9 所 示 。 把 这 些 专 
用 寄存 器 统称 为 存储 管理 寄存 器 。 

系统 表 寄 存 器 

47 16 15 0 

GDTR 32 位 线性 基地 址 ”| 16 位 表 界 限 

IDTR 32 位 线性 基地 址 ”| 16 位 表 界 限 

















系统 段 寄 存 器 段 描述 符 寄 存 器 
15 0 

LDTR | 段 选择 子 | 1 ”32 
-一 一 一 一 - 上 

TR | 段 选择 子 | | ”32 位 线性 基地 址 1 段 界限 ! 属性 


te de en ie le eh ead en ee bt ee 





一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 7 














图 9.9 存储 管理 寄存 器 


2. 全 局 描述 符 表 寄存 器 GDTR 

如 图 9.9 所 示 , 全 局 描述 符 表 寄存 器 GDTR 长 48 位 ,其 中 高 32 位 含 GDT 表 的 线性 基地 
址 , 低 16 位 含 GDT 表 的 界限 。 由 于 GDT 表 自 身 不 能 由 
GDT 表 内 的 描述 符 进 行 描述 定义 ,因此 CPU 采用 
GDTR 寄存 器 为 GDT 这 一 特殊 系统 表 提 供 一 个 伪 描 述 
符 。 由 GDTR 寄存 器 给 定 GDT 表 , 如 图 9. 10 所 示 。 

全 局 描述 符 表 寄 存 器 GDTR 中 的 表 界 限 以 字 节 为 单 8 16 位 界限 
位 。 由 于 段 选择 子 中 只 有 13 位 作为 描述 符 索引 ,而 每 个 一 | ”32 位 基地 址 
描述 符 长 8 个 字 节 ,所 以 用 16 位 足够 表示 GDT 表 的 界 ” 低 端 GDTR 
限 。 通常, 对 于 含有 个 描述 符 的 描述 符 表 的 界限 应 设 ”图 9.10 GDTR 给 定 GDT 示 意图 


线性 地 址 空间 





高 端 






































第 9 章 保护 方式 程序 设计 上 353 





置 为 8Xn 一 1。 
基于 汇编 器 NASM ,可 采用 如 下 形式 声明 一 个 宏 ,以 表示 伪 描 述 符 。 
%macro PDESC 2 


-LIMT DW %1 ;界限 ( 6 位 ) 
.BASE DmD %2 ;基地 址 ( 了 位) 
% endmacro 


【 例 9-8】 假设 已 经 声明 了 伪 描 述 符 宏 PDESC ,那么 可 以 定义 存放 伪 描 述 符 的 变量 如 下 ， 

VGDTR PESC FH 12000H ; 伪 描 述 符 

此 后 ,可 以 利用 如 下 指令 加 载 全 局 描述 符 表 寄存 器 GDTR : 

LEDT [WDTR] ;把 变量 VDTR 的 值 加 载 到 IR 

这 样 ,全 局 描述 符 表 GDT 位 于 线性 地 址 12000H 开始 处 ,并 且 含 有 6 个 描述 符 。 

3. 局 部 描述 符 表 寄存 器 LDTR 

局 部 描述 符 表 寄 存 器 LDTR 规定 当前 任务 使 用 的 局 部 描述 符 表 LDT。 如 图 9. 9 所 示 ， 
LDTR 寄存 器 类 似 于 段 寄存 器 ,由 可 见 的 16 位 寄存 器 和 隐藏 的 高 速 缓冲 存储 器 ( 段 描述 符 寄 
存 器 ) 构 成 。 

每 个 任务 的 局 部 描述 符 表 LDT 作为 系统 的 一 个 特殊 段 ,由 一 个 描述 符 来 描述 ,用 于 描述 
LDT 段 的 描述 符 存 放 在 GDT 表 中 。 在 初始 化 或 任务 切换 过 程 中 ,把 指示 对 应 任务 LDT 描述 
符 的 段 选择 子 装 入 LDTR 寄存 器 ,CPU 根据 装 入 LDTR 寄存 器 可 见 部 分 的 选择 子 , 从 GDT 
表 中 取出 对 应 的 描述 符 , 并 把 LDT 段 的 基地 址 和 段 界限 等 信息 保存 到 LDTR 寄存 器 隐藏 的 
高 速 缓冲 存储 器 中 ,如 图 9. 11 所 示 。 随 后 在 访问 LDT 段 时 ,就 可 根据 保存 在 高 速 缓冲 存储 器 
中 的 有 关 信 息 进 行 合法 性 检测 。 
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图 9.11 GDT 和 LDT 及 其 寄存 器 


LDTR 寄存 器 包含 当前 任务 LDT 表 的 段 选择 子 。 所 以 , 装 入 到 LDTR 寄存 器 的 段 选择 
子 必须 指示 一 个 位 于 GDT 表 的 类 型 为 LDT 的 系统 段 描述 符 , 也 即 选 择 子 中 的 TI 位 必须 是 
0, 而 且 描述 符 中 的 类 型 必须 是 LDT 类 型 。 

可 以 用 一 个 空 选择 子 装 和 人 LDTR 寄存 器 ,这 表示 当前 任务 没有 局 部 描述 符 表 LDT。 这 种 
情况 下 ,所 有 装 入 到 段 寄 存 器 的 段 选择 子 都 必须 指示 GDT 表 中 的 描述 符 , 也 即 当 前 任务 涉及 
的 段 均 由 GDT 表 中 的 描述 符 来 描述 ,如 果 再 把 一 个 TI 为 1 的 选择 子 装 入 到 段 寄存 器 ,将 引 
起 异常 。 
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4. 中 断 描述 符 表 寄存 器 IDTR 

中 断 描述 符 表 寄 存 器 IDTR 指向 中 断 描 述 符 表 IDT。 如 图 9. 9 所 示 ,IDTR 寄存 器 长 48 
位 ,其 中 32 位 的 基地 址 规定 IDT 表 的 线性 基地 址 ,16 位 的 界限 规定 IDT 表 的 界限 。 由 于 
IA-32 系列 CPU 只 支持 256 个 中 断 /异常 ,因此 IDT 表 最 大 长 度 是 2KB, 以 字 节 为 单位 的 表 界 
限 为 7FFH。IDTR 寄存 器 指示 IDT 表 的 方式 与 GDTR 寄存 器 指示 GDT 表 的 方式 相同 。 

5. 任务 寄存 器 TR(Task Register) 

任务 寄存 器 TR 包含 指示 任务 状态 段 描述 符 的 段 选 择 子 ,从 而 规定 了 当前 任务 的 状态 段 。 
如 图 9. 9 所 示 ,TR 寄存 器 也 有 可 见 和 隐藏 两 部 分 构成 。 当 把 任务 状态 段 的 段 选择 子 装 和 人 到 
TR 寄存 器 可 见 部 分 时 ,CPU 自动 把 段 选择 子 所 索引 的 描述 符 中 的 段 基地 址 等 信息 保存 到 隐 
藏 的 高 速 缓冲 存储 器 中 。 在 此 之 后 对 当前 任务 状态 段 的 访问 可 快速 方便 地 进行 。 装 人 到 TR 
寄存 器 的 段 选择 子 不 能 为 空 ,必须 索引 位 于 GDT 表 中 的 描述 符 , 且 描述 符 的 类 型 必须 是 TSS 
类 型 。 


9.3.2 控制 寄存 器 


1. 关于 控制 寄存 器 

IA-32 系列 CPU 有 5 个 32 位 的 控制 寄存 器 ,被 分 别 命名 为 CRO、CR1、CR2、CR3 和 
CR4。 它 们 包含 了 一 批 控制 位 和 分 页 存储 管理 机 制 所 使 用 的 地 址 ,如 图 9. 12 所 示 。 随 着 
IA-32 系列 CPU 不 断 推陈出新 ,逐步 增加 了 控制 位 ,以 支持 CPU 新 增 功能 。Intel 80386 CPU 
并 没有 CR4 ,直到 Pentium 才 有 CR4。 

如 图 9. 12 所 示 ,阴影 部 分 的 这 些 位 被 保留 ,一 般 应 该 被 置 为 0, 或 者 不 能 更 改 其 原 有 值 。 
标记 号 X 的 位 ,虽然 已 经 有 具体 定义 ,但 这 里 不 作 具 体 介 绍 。 控 制 寄存 器 CR1 一 直 被 保留 ,不 
能 使 用 CR1 ,否则 将 引起 无 效 指令 操作 异常 。 

下 面 介绍 两 个 重要 的 控制 位 PE 和 PG ,简单 说 明 CR2 和 CR3。 
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图 9. 12 控制 寄存 器 
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2. 保护 控制 位 

控制 寄存 器 CR0 中 的 位 0 用 PE(Protection Enable) 标 记 , 位 31 用 PG (Paging) 标 记 , 这 
两 个 位 控制 分 段 和 分 页 存储 管理 机 制 ,因此 把 它们 称 为 保护 控制 位 。PE 控制 分 段 存 储 管理 
机 制 。PE 二 0, 处 理 器 运行 于 实 方式 ; PE 二 1, 处 理 器 运行 于 保护 方式 。PG 控制 分 页 存储 管理 
机 制 。PG 一 0, 禁 用 分 页 存储 管理 机 制 , 此 时 分 段 管理 机 制 产生 的 线性 地 址 直接 作为 物理 地 址 使 
用 ; PG 二 1, 启 用 分 页 存储 管理 机 制 ,此 时 线性 地 址 经 过 分 页 存储 管理 机 制 转换 成 物理 地 址 。 

表 9. 2 列 出 了 通过 使 用 PE 位 和 PG 位 选择 的 处 理 器 工作 方式 。 由 于 只 有 在 保护 方式 下 
才 可 启用 分 页 机 制 , 因 此 尽管 两 个 位 分 别 为 0 和 1 有 4 种 组 合 ,但 只 有 3 种 组 合 方式 有 效 。 
PE==0 且 PG 二 1 是 无 效 的 组 合 , 因 此 用 PG 位 为 1 且 PE 位 为 0 的 值 装 入 CR0 寄存 器 将 引起 
异常 。 

表 9.2 PG/PE 位 与 处 理 器 工作 方式 





PG PE 处 理 器 工作 方式 

0 0 实 方式 

0 出 保护 方式 ,禁用 分 页 机 制 
1 0 非法 组 合 

1 1 保护 方式 ,启用 分 页 机 制 


【 例 9-9】 如 下 代码 片段 将 控制 寄存 器 CR0 的 PE 位 清 成 0, 准 备 使 CPU 进入 实 方式 。 


MW ”EAX CRO ;复制 CR 到 EAX 
AD EAX OFFFFFFFEH 清 虹 的 第 0 位 
MY CRO EX 清 0 中 的 外 位 


3. 控制 寄存 器 CR2 和 CR3 

控制 寄存 器 CR2 和 CR3 由 分 页 存储 管理 机 制 使 用 。 在 9. 5 节 具 体 介绍 分 页 存储 管理 机 制 。 

控制 寄存 器 CR2 用 于 在 发 生 页 故障 时 报告 故障 地 址 。 当 发 生 页 故障 时 ,CPU 把 引起 页 
故障 的 线性 地 址 保存 于 CR2 中 。 操 作 系统 的 页 故障 处 理 程序 可 以 分 析 CR2 的 内 容 ,从 而 确 
定 线性 空间 中 的 哪 一 页 引起 本 次 页 故障 。 

控制 寄存 器 CR3 用 于 保存 页 目录 的 起 始 物理 地 址 ,所 以 也 被 称 为 页 目录 基地 址 寄存 器 
(PDBR) 。 由 于 页 目录 一 定 是 页 (4KB) 对 齐 的 ,因此 仅 使 用 高 20 位 表示 页 目录 的 基地 址 , 低 
12 位 被 认为 是 0。 在 9.5 节 的 示例 将 演示 分 页 存储 管理 机 制 的 使 用 。 

4. 其 他 控制 位 

控制 寄存 器 CR0 中 的 WP 位 是 写 保 护 (Write Protect) 位 , 始 于 Intel 80486 处 理 器 。 当 
WP=1 时 ,系统 级 程序 不 能 够 向 只 读 / 执 行 的 用 户 页 进行 写 操作 。 人 参见 9. 5. 3 节 的 页 级 保护 。 

控制 寄存 器 CR0 中 的 TS 位 是 任务 切换 (Task Switched) 位 ,在 每 次 任务 切换 后 ,设置 该 
位 ,也 即 TS==1。 这 样 只 有 在 新 任务 中 执行 诸如 MMX 指令 和 SSE 指令 等 时 , 才 保 存 这 些 指 
令 相关 的 现场 。 

控制 寄存 器 CR0 中 的 CD 位 和 NW 位 ,用 于 控制 片上 超 高 速 缓存 的 工作 方式 。 控 制 寄存 
器 CR0 中 的 对 齐 屏 蔽 位 AM ,控制 标志 寄存 器 EFLAGS 中 的 对 齐 检查 标志 AC 是 否 有 效 。 这 
3 个 控制 位 ,也 都 始 于 Intel 80486 处 理 器 。 

控制 寄存 器 CR3 中 的 PWT 位 和 PCD 位 ,用 于 控制 页 目录 的 缓冲 策略 。 

控制 寄存 器 CR4 中 的 PSE(Page Size Extensions) 位 ,用 于 控制 页 尺寸 , 当 PSE 二 1 时 ,页 
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的 尺寸 可 以 达到 4MB。CR4 中 的 PAE(Physical Address Extension) 位 ,用 于 控制 启用 36 位 
物理 地 址 , 始 于 Pentium Pro。CR4 中 的 PGE(Page Global Enable) 位 ,用 于 控制 全 局 页 的 使 
用 ,该 控制 位 始 于 P6 处 理 器 。 


9.3.3 相关 存 取 指 令 


下 面 简 要 介绍 存 取 存储 管理 寄存 器 和 控制 寄存 器 的 有 关 指令 。 

1. 存 取 GDTR 寄存 器 的 指令 

(1) 装载 GDTR 寄存 器 的 指令 

装载 全 局 描述 符 表 寄 存 器 GDTR 指令 的 格式 如 下 : 

LOT Sm 

其 中 ,操作 数 SRC 是 48 位 (6 字 节 ) 的 存储 器 操作 数 。 该 指令 的 功能 是 把 存储 器 中 的 伪 
描述 符 装 入 到 全 局 描述 符 表 寄存 器 GDTR。 伪 描述 符 SRC 的 结构 如 前 述 伪 描述 符 宏 PDESC 
所 示 , 低 字 是 以 字 节 为 单位 的 段 界限 ,高 双 字 是 段 基地 址 。 

【 例 9-10】 假设 在 数据 段 定 义 如 下 伪 描 述 符 。 





PtopT DW THH : 段 限 
DD 20010H ;基地 址 
还 假设 在 代码 段 安 排 如 下 装载 全 局 描述 符 表 寄存 器 GDTR 的 指令 。 
LEDT [PtogpT] 


那么 在 执行 上 述 指令 后 ,由 寄存 器 GDTR 所 给 定 的 GDT 的 基地 址 是 00020010H ,长 度 是 
80H ,也 即 可 以 容纳 16 个 描述 符 。 该 指令 采用 直接 存储 器 寻 址 方式 ,也 可 以 采用 其 他 存储 器 
寻 址 方式 。 

需要 指出 的 是 ,只 有 在 实 方式 和 保护 方式 特权 级 0 下 , 才 可 以 执行 该 指令 。 通 常 在 实 方式 
下 为 进入 保护 方式 做 准备 时 ,利用 该 指令 设置 GDTR 寄存 器 ,从 而 建立 全 局 描述 符 表 GDT。 

(2) 存储 GDTR 寄存 器 的 指令 

存储 全 局 描述 符 表 寄 存 器 GDTR 指令 的 格式 如 下 : 

ST DT 

其 中 ,操作 数 DST 是 48 位 (6 字 节 ) 的 存储 器 操作 数 。 该 指令 的 功能 是 把 全 局 描述 符 表 
寄存 器 GDTR 的 内 容 存 储 到 存储 单元 DST。 把 GDTR 内 的 16 位 界限 存 和 人 DST 的 低 字 ， 
GDTR 内 的 32 位 基地 址 存 人 DST 的 高 双 字 。 

2. 存 取 IDTR 寄存 器 的 指令 

中 断 描述 符 表 寄 存 器 IDTR 与 全 局 描述 符 表 寄 存 器 GDTR 相似 , 存 取 IDTR 寄存 器 的 指 
令 与 存 取 GDTR 寄存 器 的 指令 也 相似 。 

1) 装载 IDTR 寄存 器 的 指令 

装载 中 断 描 述 符 表 寄存 器 IDTR 指令 的 格式 如 下 : 

LI Sw 


其 中 ,操作 数 SRC 是 48 位 (6 字 节 ) 的 存储 器 操作 数 。 该 指令 的 功能 是 把 存储 器 中 的 伪 
描述 符 装 入 到 中 断 描述 符 表 寄存 器 IDTR。 
需要 指出 的 是 ,同样 只 有 在 实 方式 和 保护 方式 特权 级 0 下 , 才 可 以 执行 该 指令 。 
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2) 存储 IDTR 寄存 器 的 指令 
存储 中 断 描述 符 表 寄 存 器 IDTR 指令 的 格式 如 下 : 
SIIT DST 
其 中 ,操作 数 DST 是 48 位 (6 字 节 ) 的 存储 器 操作 数 。 该 指令 的 功能 是 把 中 断 描述 符 表 
寄存 器 IDTR 的 内 容 存 储 到 存储 单元 DST。 把 IDTR 内 的 16 位 界限 存 和 人 DST 的 低 字 ,IDTR 
内 的 32 位 基地 址 存 和 人 DST 的 高 双 字 。 
【 例 9-11】 假设 利用 伪 描 述 符 宏 PDESC ,在 数据 段 已 定义 如 下 伪 描述 符 。 
NorVIDIR PDES 0 0 ;定义 作为 伪 描 述 符 的 变量 
然后 ,可 以 利用 以 下 指令 保存 IDTR 寄存 器 的 内 容 。 
SIDT [NorVIDTR] ;保存 寄存 器 IDR 之 内 容 
可 以 利用 以 下 指令 装载 IDTR 寄存 器 。 
LIDT [NorVIDTR] ;装载 寄存 器 IDIR 
顺便 提 一 下 ,在 实 方式 下 或 者 保护 方式 16 位 段 模式 下 ,利用 上 述 存 取 GDTR 或 者 IDTR 
的 指令 时 ,实际 存 取 的 GDTR 或 者 IDTR 的 基地 址 只 有 24 位 ,并 非 32 位 ,最 高 8 位 被 清 0。 
3. 存 取 LDTR 寄存 器 的 指令 
1) 装载 LDTR 寄存 器 指令 
装载 局 部 描述 符 表 寄存 器 LDTR 指令 的 格式 如 下 : 
UDT Sm 
其 中 ,操作 数 SRC 可 以 是 16 位 通用 寄存 器 或 存储 单元 。 该 指令 的 功能 是 把 操作 数 SRC 
作为 指示 局 部 描述 符 表 LDT 段 的 选择 子 装 和 到 LDTR 寄存 器 。 
【 例 9-12】 假设 LDT_Sel 是 指示 局 部 描述 符 表 LDT 段 描述 符 的 选择 子 , 如 下 指令 片段 
装载 LDTR 寄存 器 。 


MV 以 LDT sel ;获得 选择 子 
UDT MX 装载 局 部 描述 符 表 寄存 器 LDIR 


作为 指令 操作 数 的 选择 子 应 该 指示 GDT 中 的 类 型 为 LDT 的 描述 符 。 但 SRC 也 可 以 是 
一 个 空 的 选择 子 , 这 样 意味 着 暂时 不 使 用 LDT 表 。 像 加 载 段 寄 存 器 那样 ,在 把 指示 LDT 段 
的 选择 子 装 入 到 LDTR 可 见 部 分 时 ,CPU 自动 把 对 应 LDT 段 描述 符 中 的 段 基 地 址 等 信息 装 
载 到 隐藏 的 高 速 缓冲 存储 器 中 ,参见 图 9. 11。 
需要 指出 的 是 ,只 有 在 保护 方式 且 特 权 级 0 下, 才 可 以 执行 该 指令 。 
2) 存储 LDTR 寄存 器 的 指令 
存储 局 部 描述 符 表 寄存 器 LDTR 指令 的 格式 如 下 : 
SUDT DT 
其 中 ,操作 数 DST 可 以 是 16 位 通用 寄存 器 或 存储 单元 。 该 指令 的 功能 是 把 寄存 器 LDTR 
的 可 见 部 分 保存 到 目标 DST, 也 就 是 把 指示 当前 任务 LDT 的 段 选 择 子 保存 到 目标 DST。 
【 例 9-13】 如 下 指令 把 局 部 描述 符 表 寄 存 器 LDTR 的 内 容 保 存 到 寄存 器 DX。 
SDT DX 


需要 指出 的 是 ,只 有 在 保护 方式 下 , 才 可 以 执行 该 指令 。 
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4. 存 取 TR 寄存 器 的 指令 
1) 装载 TR 寄存 器 的 指令 
装载 任务 寄存 器 TR 指令 的 格式 如 下 : 
LR Sm 
其 中 ,操作 数 SRC 可 以 是 16 位 通用 寄存 器 或 存储 单元 。 该 指令 的 功能 是 将 SRC 作为 指 
示 任 务 状态 段 描述 符 的 选择 子 装载 到 任务 寄存 器 TR。 
【 例 9-14】〗 假设 TTSS_Sel 是 指示 任务 状态 段 描述 符 的 选择 子 , 如 下 指令 片段 装载 
LDTR 寄存 器 。 
MV AX TSS Sel ;获得 选择 子 
LR A ;装载 任务 寄存 器 人 
像 加 载 段 寄存 器 那样 ,在 把 指示 任务 状态 段 的 选择 子 装 和 人 到 TR 可 见 部 分 时 ,CPU 自动 
把 对 应 任务 状态 段 描 述 符 中 的 段 基地 址 等 信息 装载 到 隐藏 的 高 速 缓冲 存储 器 中 。 操 作 数 
SRC 表示 的 选择 子 不 能 为 空 ,必须 指示 位 于 GDT 表 中 的 任务 状态 段 描述 符 。 
需要 指出 的 是 ,只 有 在 保护 方式 且 特 权 级 0 下 , 才 可 以 执行 该 指令 。 
2) 存储 TR 寄存 器 的 指令 
存储 任务 寄存 器 TR 指令 的 格式 如 下 : 
SR DT 
其 中 ,操作 数 DST 可 以 是 16 位 通用 寄存 器 或 存储 单元 。 该 指令 的 功能 是 把 任务 寄存 器 
TR 所 含 的 指示 当前 任务 状态 段 描述 符 的 选择 子 保存 到 目标 DST。 
需要 指出 的 是 ,只 有 在 保护 方式 下 , 才 可 以 执行 该 指令 。 
5. 控制 寄存 器 数据 传送 的 指令 
由 控制 寄存 器 数据 传送 指令 实现 CPU 的 控制 寄存 器 和 32 位 通用 寄存 器 之 间 的 数据 传 
送 , 从 而 实现 对 控制 寄存 器 的 存 取 。 
控制 寄存 器 数据 传送 指令 的 一 般 格式 如 下 : 
WW Dr SD 
其 中 ,操作 数 SRC 和 DST 可 以 是 CPU 使 用 的 控制 寄存 器 和 任 一 32 位 通用 寄存 器 ,但 不 
能 同时 是 控制 寄存 器 。 
【 例 9-15〗 如 下 指令 把 控制 寄存 器 CR2 的 内 容 传 送 到 EDX 寄存 器 。 


WwW Ex CR2 ;取得 引起 页 故障 的 线性 地 址 

【 例 9-16】 如 下 指令 片段 设置 指向 页 目录 的 控制 寄存 器 CR3。 
WwW EX PTAMD ;这 里 PWT 加 表示 页 目录 表 的 物理 地 址 
WW 03 EX ;设置 页 目录 寄存 器 


需要 注意 的 是 ,只 有 在 实 方式 和 保护 方式 特权 级 0 下 , 才 可 以 执行 这 些 控制 寄存 器 数据 传 


9.4 实 方式 与 保护 方式 切换 示例 


本 节 给 出 3 个 演示 实 方式 与 保护 方式 切换 的 示例 ,说 明 实现 IA-32 系列 CPU 两 种 工作 方 
式 切换 的 具体 方法 ,初步 展现 保护 方式 下 的 程序 设计 。 
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9.4.1 实 方式 和 保护 方式 切换 的 演示 (示例 一 ) 


示例 一 的 逻辑 功能 是 ,以 十 六 进 制 数 形式 显示 内 存 地 址 FFFFFFFOH 开始 的 8 个 字 节 的 
值 。 本 示例 指定 内 存 高 端 区 域 的 目的 仅仅 是 说 明 切 换 到 保护 方式 的 必要 性 ,因为 在 实 方式 下 
不 能 访问 该 内 存 区 域 ,只 有 在 保护 方式 下 才能 访问 到 该 指定 区 域 。 在 PC 及 其 兼容 机 上 ,该 区 
域 位 于 ROM 中 ,是 开机 时 首先 执行 的 代码 。 

1. 执行 步 又 

示例 一 的 主要 执行 步骤 如 下 。 

(1) 进行 由 实 方式 切换 到 保护 方式 的 准备 ,主要 包括 建立 全 局 描述 符 表 GDT ,加载 全 局 
描述 符 表 寄 存 器 GDTR 。 

(2) 从 实 方式 切换 到 保护 方式 。 

(3) 把 指定 的 高 端 内 存 区 域 的 数据 传送 到 位 于 常规 内 存 的 缓冲 区 中 。 

(4) 从 保护 方式 切换 回 到 实 方式 。 

(5) 以 十 六 进 制 数 形式 显示 缓冲 区 数据 。 

2. 源 程序 

示例 一 的 源 程序 dp91. asm 如 下 : 


;演示 实 方式 和 保护 方式 之 间 的 切换 ( 示例 一 , q91) 


i ;常量 声明 
ATDW EU OPH :存在 的 可 读 写 数 据 段 的 属性 值 
ATCE Ey OpeH :存在 的 只 执行 代码 段 的 属性 值 
% macro DESCRIPTOR 5 ;表示 存储 段 描 述 符 结构 的 宏 
.LIMIT om %1 疲 界 限 ( 0 15) 
.BASBL_ Dm %2 逆 基 地 址 ( 0 15) 
.BASEM DB %3 疲 基 地 址 ( 16 29) 
.ATIRI Do %4 : 段 属性 
.BASEH DB %5 疲 基地 址 (24 31) 
% endmacro 
% macro PDESC 2 ;表示 QDIR 伪 描述 符 结构 的 宏 
.LIMIT Do %1 ;界限 ( 6 位 ) 
.BASE DD %2 ;基地 址 (了 位 ) 
% endmacro 
section text ;有 段 text 
bits 16 ;6 位 段 模式 
;工作 程序 特征 信息 
Sigatuwre 由 " YANG" ;签名 信息 
Version dn 1 :格式 版 本 
Length dn end_of_text ;工作 程序 长 度 
Start dn Begin ;工作 程序 入 口 点 的 偏 移 
Zoneseg dy 2000H ;工作 程序 期 望 的 内 存 区 域 起 始 段 值 
Reserved dd 0 ;保留 








GDTSeg: ;全 局 描述 符 表 GOT 
Dumy DESCRIPTOR 00000 ; 哑 描 述 符 
OE DESCRIPTOR CFFFFH 0.0 ATCE,0 ;代码 段 描述 符 
Code Sel equ OODE GDTSeg ;代码 段 描述 的 选择 子 
DATAD DESCRIPTOR OFFHOOAIWO ;目标 数据 段 描述 符 
DataD Sel eq DATAD- GDTSeg 泪 标 数据 段 描 述 符 的 选择 子 
DATAS DESCRIPTOR OFFFFH OFFFOH OFFH AIDW QFFH 。”; 源 数据 段 描 述 符 
DataS Sel eq DATAS- GDTSeg 源 数 据 段 描述 符 的 选择 子 
LenGDT equ $- GDTSeg ;00T 表 长 度 
LerBuff eq 5% ;缓冲 区 字 节 长 度 
Buffer 

times LerBuff 中 了 ;缓冲 区 
VGDTR PDESC LerntpI- 1, 0 奉 放 伪 描 述 符 的 变量 /人 @1 
Begin: 

WwW A 人 OC 

WW Ds MX 

MV [ToRealt 5, MX 带 定 位 段 间 转 移 指令 中 的 段 值 /@2 

;初始 化 @T 中 的 部 分 描述 符 

WwW B16 

MV AMC 

ML BX ;DX:AE 示例 程序 所 占 区 域 起 始 地 址 

MY [ODEBASE], AX 

MV [ODEBASEM], DL 设置 代码 段 描 述 符 中 的 基地 址 

MV [oopE BASEH], DH 

MV [DATAD.BASE-], AX 

MV [DATAD.BASEM], DL ;设置 目标 数据 段 描述 符 中 的 基地 址 

MV [DATAD.BASB], DH 

;初始 化 用 于 GDR 的 伪 描 述 符 

AD A GDTseg ;加 上 GOT 表 在 段 内 的 偏 移 Ma 3 

A DO :DX:AE gpT 所 在 段 的 基地 址 

MV [WDTRBASE], AX 

MY [WDTRBASE+ 2], DX ;填写 到 用 于 TR 的 伪 描 述 符 变 量 

;加 载 GOTR 

LGOT [WDTR] /4 

;其 他 准备 工作 

Ql ;关中 断 

CAL Enableh20 :打开 地 址 线 A20 

;切换 到 保护 方式 

WwW EX CR 

mR EX1 


MV CR EX ;使 得 0 中 的 蝶 1 


JP Code_Sel:PM_Entry ;真正 进入 保护 方式 Me5 


第 9 章 保护 方式 程序 设计 


361 





PM_Entry: ;现在 开始 在 保护 方式 下 


QD 
汶 传 送 数据 设置 源 数据 段 和 目标 数据 段 的 段 寄存 器 
MY A Datas sel 


MV DS, AX :加载 源 数据 段 描述 符 /@6 
MY AX DataD Sel 
MW ES AM ;加 载 目 标 数 据 段 描述 符 /@7 
;设置 段 内 偏 移 并 实施 传送 
WW Sl,0 
MY DI, Buffer 
MW C2 8 个 字 节 =2 个 双 字 
RP MVSD 
;切换 回 实 方式 
WW EX m0 
EAX OFFFFFFFEH 
MW CO, EX 清 0 中 的 在 位 /@8 
ToReal : ;真正 进入 实 方式 
JP 0O:Real ;需要 重 定位 Ma9 
Real: ;现在 回 到 了 实 方式 
CAL DisableA20 ;关闭 地 址 线 A20 
ST| “; 开 中 断 
WW MG 
WW Ds 
WY SI, Buffer ;指向 数据 缓冲 区 
W C8 ;8 个 字 节 数据 
CAL ShowBuff 以 十 六 进 制 数 形式 显示 字 节 数据 
REF ;结束 ,返回 到 加 载 器 
EnableA20: ;打开 地 址 线 A20 
PUSH 以 
IN A 9 
RR AL2 
QT MA 
pp MX 
RET 
DisableA20: 关闭 地 址 线 A2 
PUSH 以 
IN A 9 
AD AL~2 
QT MA 
POP 
FET 
ShoBuff: ;以 十 六 进 制 数 的 形式 显示 数据 
QD ;DS:SE= 缓冲 区 首 地 址 ; Ce 字 节 数 





TOASCI1: 转换 成 十 六 进 制 数字 符 ASCN 码 


.LA:RET 

end_of_text: 源 代码 到 此 结束 

从 上 述 源 程序 可 见 , 声 明了 两 个 宏 。 其 一 ,表示 存储 段 描 述 符 结构 的 宏 DESCRIPTOR， 
利用 它 定 义 GDT 中 的 描述 符 ; 其 二 ,表示 伪 描 述 符 结构 的 宏 PDESC, 利 用 它 定义 用 于 加 载 
GDTR 的 伪 描 述 符 。 声 明 这 些 宏 的 目的 是 为 了 便于 编写 源 程序 ,具体 形式 与 汇编 器 NASM 
有 关 。 

3. 内 存 映像 

在 利用 7.4 节 介 绍 的 加 载 器 把 本 示例 的 纯 二 进 制 目标 代码 加 载 到 内 存 后 ,其 映像 如 
图 9.13 所 示 。 假 设 目标 代码 占用 起 始 地 址 为 000xxxx0H 的 内 存 区 域 ,在 实 方式 下 该 地 址 的 
段 值 就 是 xxxxH。 可 以 认为 ,示例 程序 的 代码 部 分 和 各 项 数据 都 在 同一 个 段 内 ,它们 的 位 置 
可 以 由 相对 于 段 基 地 址 的 偏 移 来 表示 。 

4. 关于 执行 步 又 的 注释 

下 面 结 合 示例 一 源 程序 对 主要 执行 步骤 作 些 说 明 。 

(1) 切换 到 保护 方式 的 准备 工作 。 在 从 实 方式 切换 到 保护 方式 之 前 ,必须 做 必要 的 准备 。 
准备 工作 的 内 容 根 据 具 体 应 用 需要 而 定 。 最 起 码 的 准备 工作 是 建立 合适 的 全 局 描述 符 表 
GDT ,并 使 得 全 局 描述 符 表 寄存 器 GDTR 指向 GDT 表 。 因 为 在 切换 到 保护 方式 之 时 ,至 少 


第 9 章 保护 方式 程序 设计 353 



























































FFFFFFFF 
RNY FrrrrFFo 
00100000 
000zzzzz 
代码 部 分 
1 伪 播 述 符 
示 程 序 
实 方式 下 缓冲 区 放风 
数据 段 描述 符 DATAS 
数据 段 描述 符 DATAD 
GDT 
代码 段 描述 符 CODE 
哑 描 述 符 
一 000yyyyy 
工作 程序 特征 信息 
一 000xxxx0 
00000000 


9.13 示例 一 的 内 存 映像 示意 图 


要 把 代码 段 的 选择 子 装载 到 CS, 所 以 GDT 表 中 至 少 要 含有 代码 段 的 描述 符 。 

从 本 示例 源 程 序 可 见 , 全 局 描述 符 表 GDT 仅 有 4 个 描述 符 : 第 一 个 是 哑 描 述 符 ; 第 二 个 
是 代码 段 描述 符 ; 第 三 个 和 第 四 个 是 数据 段 描述 符 。 除 了 哑 描 述 符 外 ,各 描述 符 中 的 段 界限 
是 在 定义 时 预 置 的 ,为 了 简化 ,都 规定 为 0OFFFFH。 另 外 ,这 些 描述 符 中 的 段 属性 也 根据 所 描 
述 存储 段 的 类 型 预 置 。 属 性 值 98H 表示 存在 的 只 可 执行 代码 段 ,而 且 是 16 位 代码 段 ; 属性 
值 92H 表示 存在 的 可 读 写 数据 段 。 虽 然 描述 符 DATAS 描述 的 段位 于 ROM 中 ,但 仍然 故意 
采用 了 属性 值 92H ,原因 在 9. 4. 2 节 中 说 明 。 

由 于 代码 段 和 目标 数据 段 的 起 始 位 置 取决 于 本 示例 目标 代码 被 加 载 到 内 存 的 具体 位 置 ， 
无 法 在 定义 时 确定 ,因此 需要 根据 运行 时 代码 段 的 段 值 (xxxxH), 分 别 设置 代码 段 描述 符 
CODE 和 目标 数据 段 描 述 符 DATAD 中 的 基地 址 。 这 两 个 段 的 基地 址 都 采用 示例 目标 代码 
所 占用 内 存 的 起 始 地 址 (图 9. 13 所 示 的 000xxxx0H) 。 虽 然 这 样 安排 会 导致 代码 段 CODE 和 
数据 段 DATAD 完全 重 释 ,但 确实 是 可 行 的。 至 此 ,准备 好 了 GDT 表 。 

接 下 来 准备 用 于 GDTR 寄存 器 的 伪 描 述 符 。 在 定义 伪 描 述 符 变量 VGDTR 时 ,已 经 按 
GDT 表 的 实际 长 度 设置 了 界限 。 同 样 ,还 需要 根据 运行 时 代码 段 的 段 值 , 把 GDT 表 的 基地 址 
(图 9. 13 所 示 的 000yyyyyH) 填 写 到 变量 VGDTR 中 。 和 运行 时 代码 段 的 起 始 地 址 加 上 GDT 
表 的 起 始 地 址 ( 段 内 偏 移 ) 就 是 GDT 表 的 基地 址 ,参见 源 代 码 *“//@3? 行 。 至 此 ,准备 好 了 伪 
描述 符 VGDTR。 

由 于 在 切换 到 保护 方式 后 ,就 要 引用 GDT 表 , 因 此 在 切换 到 保护 方式 之 前 必须 装载 全 局 
描述 符 表 寄 存 器 GDTR ,从 而 建立 全 局 描述 符 表 GDT。 在 准备 好 在 内 存单 元 中 的 伪 描 述 符 
后 ,装载 GDTR 寄存 器 比较 简单 ,直接 采用 如 下 加 载 GDTR 的 指令 ,参见 源 代码 “//@4” 行 。 

LOT [VDTR] 
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(2) 由 实 方式 到 保护 方式 的 切换 。 在 做 好 上 述 准备 工作 后 ,从 实 方式 切换 到 保护 方式 并 
不 繁 难 。 原 则 上 只 要 把 控制 寄存 器 CR0 中 的 PE 位 置 1 即 可 。 本 示例 采用 如 下 3 条 指令 设置 
PE 位 。 


WY EAX CR 
OR EAX 1 
WY CRO EX 


实际 情况 要 比 这 复杂 些 。 在 执行 上 面 的 3 条 指令 后 ,CPU 转 入 保护 方式 ,但 是 代码 段 寄 
存 器 CS 中 的 内 容 还 是 实 方式 下 代码 段 的 段 值 ,而 不 是 保护 方式 下 代码 段 的 选择 子 , 所 以 在 取 
指令 之 前 得 把 代码 段 的 选择 子 装 和 人 CS。 为 此 , 紧 接 着 这 3 条 指令 ,安排 如 下 的 段 间 转移 指令 ， 
参见 源 代码 “//@5” 行 ,其 中 Code_Sel 是 代码 段 选 择 子 ,标号 PM_Entry 是 进入 保护 方式 后 的 
人 人口 点 。 

JP Code_Sel:PM_Entry 

这 条 段 间 转移 指令 在 实 方式 下 被 预 取 ,在 保护 方式 下 被 执行 。 通 过 该 段 间 转移 指令 可 把 
保护 方式 下 代码 段 的 选择 子 装 入 CS, 同 时 也 刷新 指令 预 取 队 列 。 从 此 真正 进入 保护 方式 。 

(3) 由 保护 方式 到 实 方式 的 切换 。 从 保护 方式 切换 到 实 方式 的 过 程 类 似 于 从 实 方式 切换 
到 保护 方式 。 原 则 上 只 要 把 控制 寄存 器 CR0 中 的 PE 位 清 0 就 可 。 实 际 上 ,在 此 之 后 也 要 安 
排 以 下 的 段 间 转 移 指 令 ,参见 源 代码 *//@9” 行 ,其 中 标号 Real 是 回 到 实 方式 后 的 入 口 点 。 

JP 0:Real 

这 条 段 间 转移 指令 在 保护 方式 下 被 预 取 ,在 实 方式 下 被 执行 。 它 一 方面 清 指 令 预 取 队 列 ， 
另 一 方面 把 实 方式 下 代码 段 的 段 值 送 CS。 

在 表面 上 这 条 段 间 转移 指令 中 的 段 值 部 分 是 0, 但 是 实际 上 在 示例 程序 运行 之 初 已 经 修 
改过 该 指令 的 机 器 码 , 参 见 源 代码 *//@2” 行 ,把 当前 代码 段 的 段 值 直 接 填 写 到 该 段 间 转移 指 
令 机 器 码 的 段 值 部 分 。 这 是 因为 汇编 时 无 法 确定 运行 时 的 段 值 ,需要 在 运行 时 根据 实际 占用 
内 存 区 域 的 情况 来 重 定位 。 

(4) 数据 的 传送 。 传 送 数 据 是 在 保护 方式 下 进行 的 。 首 先 ,把 源 数 据 段 和 目标 数据 段 描 
述 符 的 选择 子 分 别 装 入 段 寄存 器 DS 和 ES, 参见 源 代码 “//@6” 和 “//@7” 行 。GDT 表 中 的 这 
两 个 描述 符 已 在 实 方式 下 设置 好 ,把 段 选择 子 装 入 段 寄存 器 就 意味 着 把 包括 段 基地 址 在 内 的 
段 信息 装 人 段 描 述 符 高 速 缓冲 存储 器 。 然 后 ,设置 指针 寄存 器 SI 和 DI 的 初 值 , 也 设置 计数 器 
CX 初 值 。 根 据 预 置 的 段 属性 ,在 保护 方式 下 ,代码 段 也 仅 是 16 位 段 ,字符 串 操作 指令 只 使 用 
16 位 的 SI、.DI 和 CX 等 寄存 器 。 最 后 利用 字符 串 操作 指令 实施 传送 。 

(5) 缓冲 区 数据 的 显示 。 由 于 缓冲 区 在 常规 内 存 中 ,因此 在 实 方式 下 按 十 六 进 制 数 形式 
显示 其 数据 很 容易 。 

5. 特别 说 明 

作为 第 一 个 演示 实 方式 和 保护 方式 切换 的 示例 ,对 其 做 了 大 量 的 简化 处 理 。 

通常 由 实 方式 切换 到 保护 方式 的 准备 工作 还 应 包括 建立 中 断 描述 符 表 IDT。 但 本 示例 没 
有 建立 中 断 描述 符 表 。 为 此 ,要 求 整个 执行 过 程 在 关中 断 的 情况 下 进行 ; 要 求 不 使 用 软 中 断 
指令 ; 并 且 假 设 不 发 生 任 何 异常 。 否 则 ,会 导致 系统 崩溃 。 

本 示例 没有 使 用 局 部 描述 符 表 LDT, 所 以 在 进入 保护 方式 后 没有 设置 局 部 描述 符 表 寄 存 
器 LDTR。 为 此 ,在 保护 方式 下 使 用 的 段 选择 子 都 指定 GDT 表 中 的 描述 符 。 
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本 示例 没有 定义 保护 方式 下 的 堆栈 段 ,GDT 表 中 没有 堆栈 段 描 述 符 ,在 保护 方式 下 没有 
设置 SS, 所 以 在 保护 方式 下 没有 涉及 堆栈 操作 的 指令 。 

本 示例 各 描述 符 特权 级 DPL 和 各 选择 子 请 求 特 权 级 RPL 均 是 0, 在 保护 方式 下 执行 时 的 
当前 特权 级 CPL 也 是 0。 

本 示例 没有 启用 分 页 存储 管理 机 制 , 也 即 CR0 中 的 PG 位 为 0, 线 性 地 址 就 是 存储 单元 的 
物理 地 址 。 

6. 地 址 线 A20 的 打开 和 关闭 

PC 及 其 兼容 机 的 第 20 根 地 址 线 较 特殊 ,计算 机 系统 中 一 般 安排 一 个 “ 门 ”控制 该 地 址 线 
是 否 有 效 。 为 了 访问 地 址 在 1MB 以 上 的 存储 单元 ,应 先 打开 控制 地 址 线 A20 的 “ 门 >。 这 种 
设置 与 实 方式 下 只 使 用 最 低 端 的 1MB 存储 空间 有 关 ,与 CPU 是 否 工作 在 实 方式 和 保护 方式 
无 关 , 即 使 在 关闭 地 址 线 A20 时 ,也 可 进入 保护 方式 。 

如 何 打开 和 关闭 地 址 线 A20 与 计算 机 系统 的 具体 设置 有 关 。 如 下 的 两 个 子 程序 ,在 一 般 
的 PC 及 其 兼容 机 上 都 是 可 行 的 。 

;打开 地 址 线 A20 

EnableA20: 


关闭 地 址 线 A20 
DisableA20: 
PUSH AX 
IN A 
AD A.~2 7 11101 
QT 9MA 
POP 以 
FET 


9.4.2 不 同 模式 代码 段 切换 的 演示 (示例 二 ) 


如 9.2.2 节 所 述 ,代码 段 描 述 符 中 的 了 D 位 ,指示 所 描述 的 代码 段 是 32 位 代码 段 还 是 16 位 
代码 段 , 也 即 决定 指令 使 用 的 地 址 和 操作 数 的 默认 长 度 。32 位 代码 段 和 16 位 代码 段 是 不 同 
模式 的 代码 段 ,示例 二 演示 在 不 同 模式 代码 段 之 间 的 切换 。 

1. 头 文件 DMC. H 

在 介绍 示例 二 之 前 , 先 介绍 本 章 随后 示例 都 要 使 用 到 的 头 文件 DMC. H。 

为 了 节省 篇 幅 ,提高 效率 ,把 描述 符 宏 DESCRIPTOR 和 伪 描 述 符 宏 PDESC 等 的 声明 ,还 
有 表示 描述 符 类 型 和 属性 等 的 一 系列 符号 常量 ,统一 组 织 存放 在 一 个 头 文件 中 。 头 文件 
DMC. H 的 部 分 内 容 如 下 : 

文件 名 : DWMCH 

;内 容 : 宏和 部 分 符号 常量 的 声明 





;表示 工作 程序 特征 信息 的 宏 
% macro HEADER 3 


.SIA DB "YANG" ;签名 信息 

VR mM 1 ;格式 版 本 

NT Mm %1 ;工作 程序 长 度 

.SIRT Dm %2 ;工作 程序 入 口 点 的 偏 移 

.ZNES Mm %3 ;工作 程序 期 望 的 内 存 区 域 起 始 段 值 
.RESR Dm 0 ;保留 


:表示 存储 段 描述 符 / 系 统 段 描述 符 结构 的 宏 
% macro DESCRIPTOR 与 


.LIMT DW  %1 北 界 限 ( 人 0 人 9 

BE DW  %2 : 段 基 地 址 ( 15) 

.BA DB  %3 北 基 地 址 ( 16 23) 

.ATRL DW  %4 ; 段 属性 

.BASH DB %5 : 段 基 地 址 (24 31) 

% endnacro 

;表示 伪 描 述 符 结构 的 宏 

% macro FED 2 

LIMT DW %1 ;6 界限 

.BASE DD %2 ;基地 址 

% endnacro 

;存储 段 描 述 符 类 型 值 

ATDR 在 在 的 只 读数 据 段 

ATDN :在 在 的 可 读 写 数 据 段 
AID 站 在 的 已 访问 可 读 写 数据 段 
ATDWG2 :存在 的 可 读 写 及 位 数据 段 


:在 在 的 只 执行 6 位 代码 段 
:存在 的 可 执行 可 读 6 位 代码 段 
;存在 的 只 执行 了 位 代码 段 
;存在 的 只 执行 一 致 代码 段 
:存在 的 可 执行 可 读 一 致 代码 段 


加 
BEEEREEREE 
2 


ATLDT EU a ;局 部 描述 符 表 段 类 型 值 
ATTASKGAT EU 8 :任务 门类 型 值 

ATSS2 EU 是 ;386TSS 类 型 值 

ATIONAT2 EY 8H ;386 调 用 门类 型 值 
ATIGAT2 EU 下 :386 中 断 门类 型 值 
ATIMT2 BEY gh ;3 陷阱 门类 型 值 


-描述 符 特 权 级 DR 和 请 求 特权 级 RRL 值 
DPL1 EW 2H ;DR=1 
DPL2 EW 40H ;DPL= 2 
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DPL3 Ey HH :DH=3 
RPL1 Ey oH :R=1 

RRL2 EU 0H ;RHL=2 

RRL3 Ey oH :R=3 

其 他 常量 值 

D2 EY ‘40H 地位 代码 段 标志 

TIL EU ”04 :T= 描述 符 表 标 动 

为 了 节省 篇 幅 , 以 上 只 是 头 文件 DMC. H 的 部 分 内 容 , 其 他 内 容 , 将 会 逐步 给 出 。 
2. 执行 步 又 


示例 二 的 逻辑 功能 是 ,以 十 六 进 制 数 和 ASCII 字符 两 种 形式 分 别 显示 从 内 存 地 址 
FFFFFFFOH 开始 的 16 个 字 节 的 内 容 。 

从 功能 上 看 示例 二 类 似 于 示例 一 ,但 在 实现 方法 上 却 有 一 些 变 化 , 它 更 能 反映 实 方式 和 保 
护 方 式 之 间 切 换 的 情况 。 其 主要 执行 步骤 如 下 。 

(1) 进行 由 实 方式 切换 到 保护 方式 的 准备 工作 。 

(2) 从 实 方式 切换 到 保护 方式 的 一 个 32 位 代码 段 。 

(3) 以 十 六 进 制 数 形式 显示 指定 内 存 区 域 的 内 容 , 具 体 方法 是 以 字 节 为 单位 取得 指定 内 
存 区 域 的 内 容 , 并 将 其 转换 成 对 应 十 六 进 制 数 的 ASCII 码 ,然后 直接 填写 到 显示 存储 区 以 实 
现 显示 。 

(4) 切换 到 保护 方式 下 的 一 个 16 位 代码 段 。 

(5) 把 指定 内 存 区 域 的 内 容 直 接 作为 ASCII 码 填 人 显示 存储 区 以 实现 显示 。 

(6) 从 保护 方式 切换 回 到 实 方式 。 

3. 源 程序 

示例 二 的 源 程序 dp92. asm 如 下 : 

演示 也 位 代码 段 和 16 位 代码 段 之 间 的 切换 ( 示例 二 ,dg2) 


% include ”DCH" 文件 CH 含有 宏 的 声明 和 符号 常量 等 
; 常量 声明 
OOUNT EY 16 ;6 个 字 节 
OOLOR EU 4 ;显示 属性 ( 红 底 白字 ) 
section text : 段 text 
bits 16 ;16 位 段 模式 
Head: ;工作 程序 特征 信息 
HEADER end_of_text, Begin, 200H 
GDTSeg: ;全 局 描述 符 表 GOT 
Dumy DESCRIPTR 00000 ;: 旺 描述 符 
Nomal DESCRIPTOR OFFFFHOQAIW0 
Nomal_Sel eq Nomal- GDTSesg ;规范 段 描述 符 的 选择 子 
STACKS DESCRIPTOR OFFFFH 0.0. AIDWA.O 
StackS Sel equ STAKS- GDTSeg ; 推 栈 段 描述 符 的 选择 子 
OPE16 DESCRIPTOR ”OFFFFH Codel6Seg 0 ATCE,O 
Code16 Sel eq OPE16- GDTSeg ;6 位 代码 段 描述 的 选择 子 


O0DE32 DESCRIPTOR ”Len0ode32_ 1, Code32Seg ,0 ATCE32 0 








Code32 Sel ”equ 00DE32- GDTSeg ;2 位 代码 段 描述 的 选择 子 
DATAS DESCRIPTOR ”OOUNT- 1, CFFFOH OFFH ATDR OFFH ; 
DataS Sel 。 eq DATAS- GDTSeg 源 数据 段 描述 符 的 选择 子 
VIDEOVEM DESCRIPTOR “FFH 8000H (BH AIW 0 
Wem_Sel equ VIDEOEM- GDTSeg 淖 标 数据 段 描述 符 的 选择 子 
LenGDT eq $- GDTseg ;GOT 表 长 
;演示 用 的 了 2 位 的 代码 段 

alim 16 ;16 字 节 对 齐 

bits 22 ;通知 汇编 器 采用 了 位 段 模式 Ma0 
Code32Seg: 
Code32 Entry eq $- Code3sSeg /1 

WV AX StadS Sel 

MV ss, MX 装载 堆栈 段 寄 存 器 SS 

MY AX Datas Sel 

MY DS, MX ;装载 数据 段 

MV 以 Wem Sel 

WwW EX ;装载 视频 存储 区 段 

MW Esl,0 ;设置 指针 和 计数 器 /@2 

MW EI, 10r 80k 2 ;显示 位 置 从 第 10 行 首开 始 

MV EX ONT ;学 节 数 

QD 
.Next: 

LODSB ;: 取 一 字 节 

PUSH 以 

CAL TONSCN ; 低 4 位 转换 成 ASCINI 

MV A OLR ;显示 颜色 

SH EX16 ;保存 到 E 以 高 16 位 

PP MX 

SR AL4 

CAL TOASCII 注 4 位 转换 成 ASCI1 

WW A OOLOR ;显示 颜色 

STOSD ;直接 写 屏 方式 显示 两 个 字符 

WwW A 2H 

STOSN 显示 空格 

LOOP .Next 


:切换 到 人 6 位 的 代码 自 
JP Codel6 Sel:Code16 _ Entry 


TOASCI1: ;转换 成 十 六 进 制 数 的 ASCI1 码 
AD A OH 
AD AL 30H 
OP 人 L 了 
JE  .A 
AD AL7 
LA:RET 


Ler0ode22 eq $— Code37Seg ; 乌 位 代码 段 的 长 度 
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演示 用 的 人 6 位 的 代码 自 


align 
bits 
Codelkseg: 


Codel6 Entry equ $- Codeltseg 


与 3 Ba BIR aa 


16 
16 


Sl, SI 

DI, 12+ 80k 2 
A OLR 
CX OOUNT 


;16 字 节 对 齐 
;通知 汇编 器 采用 16 位 段 模式 


;Ma3 
;设置 指针 和 计数 器 M@4 
;显示 位 置 在 第 人 2 行 首 
;显示 颜色 

闻 节 数 


;取得 指定 区 域内 容 
:直接 作为 AScNI 码 显示 


/5 
;把 Nomal 段 选择 子 装 和 了 和 包 


;切换 到 实 方式 


真正 进入 实 方式 
;需要 重 定位 段 值 部 分 


;16 字 节 对 齐 
;6 位 段 模式 
; 伪 描 述 符 
;用 于 保存 SS 的 变量 


形成 正确 的 段 间 转移 指令 ( 重 定位 ) 


:DX:AE 目标 代码 所 占 区 域 的 起 始 地 址 
/6 
;DX:AE 了 位 代码 段 的 基地 址 


;设置 了 位 代码 段 描述 符 中 的 基地 址 


:DX:AE 目标 代码 所 占 区 域 的 起 始 地 址 


alin 16 
bits 16 
VGDTR PDESC LertDI- 1, 0 
VARSS DN 0 
Begin: 
MW A OC 
MW DM 
WY [ToRealt I, MX 
; 彻 始 化 @T 中 的 部 分 描述 符 
MW B16 
MW MXC 
ML BX 
AD AX [ODE BASE] 
Ar 区 0 
MY [ODERBASE], MX 
MY [ODE32 BASEM], DL 
MV [ODE32 BASEH], DH 
MW A OC 
ML BX 
AD AX [ODE16BASE] 


/7 








A DO :DX:AE 16 位 代码 段 的 基地 址 
MV [ODEIGBASE], AX 
MXV [ODEI6BASEM], DL ;设置 6 位 代码 段 描述 符 中 的 基地 址 
MY [ODE16BASEH], DH 
WW A Ss 
ML BX :DX:AE 当前 堆栈 段 的 基地 址 
MV [CSTAKSBASE-], AX ;Ma8 
MN [STACKS.BASEM], DL 设置 堆栈 段 描述 符 中 的 基地 址 
MV CSTACKS. BASEH], DH 
MV [VARSS], SS ;保存 实 方式 下 的 堆栈 段 SMa9 
;初始 化 用 于 GDR 的 伪 描 述 符 
MV 俯 G 
ML BX :DX:AE 目标 代码 所 占 区 域 的 起 始 地 址 
AD A GDTseg 
A DO :DX:AE GT 所 在 段 的 基地 址 
MV [CWDTRBASE], AX 
MV [VDTR BASE+ 2], DX ;填写 到 用 于 GDR 的 伪 描述 符 
LOT [VDTR] :加载 GOTR 
Ql ;关中 断 
COAL EnableA20 ;打开 地 址 线 A2 
WW EM CRO ;切换 到 保护 方式 
mR EX1 
MV CRO EX ;使 得 0 中 的 了 拒 1 
: ;真正 进入 保护 方式 
JWP 。 Code32 Sel:Code32 Entry 
Real: ;现在 回 到 了 实 方式 
WW MOC 
WW Ds 
MN SS, [VARSS] 恢复 实 方式 下 的 SMa10 
CAL ”Disableh20 ;关闭 地 址 线 A20 
ST ; 开 中 断 
FETF ;返回 到 加 载 器 
EnableA20: :打开 地 址 线 A20 
PUSH A 
IN AL 9 
OR AL 2 
QT MA 
PP AM 
FET 
DisableA20 关闭 地 址 线 A20 
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司 恕 日 各 三 昌 
E 
产 


end_of_text: 源 程序 到 此 为 止 


从 上 述 源 程序 可 知 , 利 用 汇编 器 NASM 提供 的 指示 %include, 包 含 了 头 文件 DMC. H。 


4. 内 存 映 像 


在 利用 7.4 节 介 绍 的 加 载 器 把 本 示例 的 目标 代码 加 载 到 内 存 后 ,其 映像 如 图 9. 14 所 示 。 
尽管 示例 程序 自身 的 代码 和 数据 仍然 在 一 个 物理 段 的 范围 内 ,但 是 也 可 以 认为 它们 各 自 是 独 


立 的 段 , 如 果 段 限 较 大 ,那么 可 能 会 有 部 分 重生 。 





















































FFFFFFFF 
FFFFFFFO 
00100000 
视频 存储 区 
O00 
O000zzzzz 
实 方式 下 数据 和 代码 
保护 方式 16 位 代码 段 
| 演示 程序 
| 保护 方式 32 位 代码 段 目标 代码 
视频 存储 区 描述 符 
-到 数据 段 描述 符 DATAS 
一 一 “代码 段 描述 符 CODE32 Di 
代码 段 描述 符 CODE16 
堆栈 段 描述 符 STACKS 
规范 描述 符 
哑 描 述 符 
ee O00yyyyy 
工作 程序 特征 信息 
O00xxxx0 
堆栈 区 域 
00000000 





图 9.14 示例 二 的 内 存 映像 示意 图 


从 源 程 序 可 知 ,为 了 提高 效率 ,利用 指示 语句 align, 使 得 32 位 代码 段 、16 位 代码 段 和 实 方 


式 下 的 代码 指令 三 部 分 的 起 点 都 满足 16 字 节 对 齐 。 
5. 关于 执行 步 具 的 注释 


下 面 结合 源 程序 对 有 关 执 行 步骤 作 些 说 明 ,与 示例 一 相同 的 部 分 ,不 再 袭 述 。 

(1) 切换 到 保护 方式 的 准备 工作 。 这 里 的 全 局 描述 符 表 GDT 含有 7 个 描述 符 。 有 一 个 
32 位 代码 段 的 描述 符 CODE32 ,描述 32 位 代码 段 ,其 属性 字段 中 的 D 位 是 1。 有 一 个 描述 堆 
栈 段 的 描述 符 STACKS, 其 属性 字段 中 的 D 位 是 0: 表 示 是 16 位 堆栈 段 。 一 个 数据 段 描述 符 





述 视 频 存储 区 。 

从 源 程序 可 知 , 在 利用 宏 DESCRIPTOR 定义 这 些 描述 符 时 ,已 经 设置 了 段 界限 。 根 据 相 
应 段 的 长 度 ,设置 了 描述 符 CODE32、 描 述 符 DATAS 和 描述 符 VIDEOMEM 中 的 段 界限 。 
其 他 描述 符 中 的 段 界限 , 仍 被 设置 成 OFFFFH 。 

根据 CODE32 段 和 CODE16 段 所 占用 的 内 存 区 域 ,分 别 设置 了 对 应 描述 符 中 的 段 基地 
址 。 为 了 体现 与 示例 一 的 差异 ,认为 它们 各 自 的 段 基 地 址 是 对 应 代码 的 起 始 地 址 ,如 图 9. 14 
所 示 。 示 例 程序 目标 代码 占用 内 存 的 起 始 地 址 (000xxxx0H) 加 上 对 应 段 代码 开始 处 的 偏 移 
值 ( 相 对 于 示例 程序 ) ,可 得 到 段 的 基地 址 ,参见 源 程序 “//@6” 和 “//@7” 行 。 例 如 ,在 演示 程 
序 内 ,标号 Codel6Seg 表示 CODE16 段 的 起 点 位 置 处 的 偏 移 。 从 源 程序 可 见 , 在 定义 
CODE16 描述 符 时 ,已 经 预 置 了 Codel6Seg, 把 它 与 示例 程序 起 始 地 址 相 加 ,就 得 到 CODE16 
段 的 基地 址 。 注 意 ,在 CODE16 段 的 段 内 ,标号 Codel6Seg 位 置 处 的 偏 移 实际 上 是 0。 

本 示例 程序 没有 安排 自己 的 堆栈 空间 ,在 进入 演示 程序 后 ,沿用 加 载 器 所 用 的 堆栈 。 为 
此 ,把 当前 堆栈 段 的 基地 址 , 填 人 堆栈 段 描述 符 STACKS 中 ,参见 源 程序 “//@8” 行 。 

(2) 工作 方式 的 切换 。 由 实 方式 切换 到 保护 方式 32 位 代码 段 的 方法 ,与 示例 一 中 切换 到 
保护 方式 16 位 代码 段 的 方法 相似 ,真正 进入 保护 方式 的 指令 如 下 : 

JWP Code32 Sel:Code Entry 

从 源 代码 可 见 , 其 中 Code32_Entry 是 一 个 差 值 ,表示 入 口 点 在 CODE32 段 内 的 偏 移 。 为 
什么 没有 直接 采用 入 口 标 号 Code32Seg 来 表示 ? 

在 32 位 代码 段 CODE32 中 ,通过 如 下 段 间 转 移 指令 从 32 位 代码 段 切换 到 16 位 代码 段 : 

JWP Codel6 Sel:Code16 Entry 

由 于 该 指令 在 32 位 代码 段 中 ,因此 采用 48 位 的 指针 ,其 高 16 位 是 代码 段 选 择 子 , 低 32 
位 是 CODE16 段 中 的 入 口 偏 移 。 该 指令 在 32 位 方式 下 预 取 ,在 16 位 方式 下 执行 。 注 意 ， 
Codel6_Entry 也 是 在 CODE16 段 内 的 偏 移 。 

由 保护 方式 16 位 代码 段 CODE16 切换 回 实 方式 的 方法 与 示例 一 相同 。 

(3) 指定 区 域内 容 的 显示 。 为 了 较 好 地 演示 ,在 保护 方式 下 ,采用 直接 填写 视频 存储 区 的 
方法 实现 显示 。 在 7. 3.3 节 介绍 了 直接 写 屏 显示 方式 。 视 频 存储 区 的 起 始 地 址 是 
000B8000H ,在 定义 描述 符 VIDEOMEM 时 ,已 经 预 置 受 了 段 基地 址 。 

6. 特别 说 明 

本 示例 虽然 没有 自己 专用 的 堆栈 空间 ,但 还 是 在 原 堆栈 的 基础 上 建立 了 保护 方式 下 的 堆 
栈 段 , 所 以 在 保护 方式 下 可 以 使 用 涉及 堆栈 操作 的 指令 ,包括 调用 子 程序 。 

本 示例 仍然 做 了 大 量 简单 化 处 理 。 没 有 建立 局 部 描述 符 表 LDT 和 中 断 描述 符 表 IDT 
等 ,特权 级 都 是 0, 也 没有 启用 分 页 存储 管理 机 制 。 

从 本 示例 的 GDT 表 可 知 ,两 个 数据 段 的 界限 都 是 根据 实际 大 小 而 设置 的 。 在 切换 回 实 
方式 之 前 ,把 一 个 指向 似乎 没有 用 的 数据 段 描述 符 Normal 的 选择 子 装载 到 段 寄 存 器 DS 和 
ES, 参 见 源 程序 “//@4” 行 。 

在 9. 2.5 节 介 绍 过 每 个 段 寄 存 器 都 配 有 隐藏 的 段 描 述 符 高 速 缓冲 存储 器 ,在 实 方式 下 这 
些 高 速 缓冲 存储 器 也 会 发 挥 作用 。 段 基地 址 仍 是 32 位 ,其 值 是 相应 段 寄 存 器 值 ( 段 值 ) 乘 以 
16 ,在 把 段 值 装载 到 段 寄 存 器 时 刷新 。 由 于 其 值 是 16 位 段 值 乘 上 16 ,因此 在 实 方式 下 段 基地 


第 9 章 保护 方式 程序 设计 “33 





址 的 实际 有 效 位 只 有 20 位 。 每 个 段 的 段 界限 都 固定 为 0OFFFFH ,有 段 属性 也 必须 符合 实 方式 操 
作 要 求 。 但 是 ,在 实 方式 下 无 法 设置 高 速 缓冲 存储 器 中 的 段 界 限 和 属性 ,只 能 继续 沿用 保护 方 
式 下 所 设置 的 值 。 因 此 ,在 准备 结束 保护 方式 回 到 实 方式 之 前 ,需要 通过 加 载 一 个 合适 的 描述 
符 的 段 选择 子 到 有 关 段 寄存 器 ,以 使 得 对 应 段 描 述 符 高 速 缓冲 存储 器 中 含有 合适 的 段 界限 和 
属性 。 

本 示例 GDT 表 中 的 段 描述 符 Normal 就 是 这 样 的 一 个 描述 符 ,在 返回 实 方式 之 前 把 对 应 
选择 子 Normal_Sel 加 载 到 段 寄 存 器 DS 和 ES 就 是 为 此 目的 ,参见 源 程序 “//@5” 行 。 由 于 堆 
栈 段 描述 符 STACKS 中 的 段 界限 和 属性 能 够 满足 实 方式 的 需要 ,因此 在 返回 实 方式 之 前 没有 
重新 加 载 堆栈 段 寄 存 器 SS。 代码 段 描述 符 CODE16 中 的 内 容 也 符合 实 方式 的 要 求 ,所 以 在 通 
过 16 位 代码 段 返回 实 方式 时 ,CS 段 描 述 符 高 速 缓冲 存储 器 中 的 内 容 也 是 符合 要 求 的 。 顺 便 
说 一 下 ,示例 一 中 的 描述 符 都 是 符合 实 方式 要 求 的 。 

7. 关于 32 位 代码 段 程序 设计 的 说 明 

在 32 位 代码 段 中 ,默认 的 操作 数 长 度 是 32 位 ,默认 的 存储 单元 地 址 长 度 也 是 32 位 。 务 
必 注 意 ,在 描述 符 类 型 中 表明 32 位 的 代码 段 ,在 源 程序 中 必须 采用 32 位 的 段 模式 ,参见 源 程 
序 “//@0” 行 。 

在 按 32 位 模式 执行 代码 时 ,字符 串 操 作 指 令 使 用 的 指针 寄存 器 是 ESI 和 EDI,LOOP 指 
令 使 用 的 计数 器 是 ECX。 所 以 在 32 位 代码 段 中 ,为 了 使 用 字符 串 操作 指令 ,对 ESI 和 EDI 等 
寄存 器 赋 初 值 ,参见 源 程序 “//@2” 行 。 请 比较 16 位 代码 段 中 的 相关 片段 (参见 源 程序 
“//@4” 行 ) 和 示例 一 中 的 相关 片段 。 


9.4.3 局 部 描述 符 表 使 用 的 演示 (示例 三 ) 


一 个 任务 可 以 拥有 属于 自己 的 局 部 描述 符 表 LDT。 选 择 子 中 的 TI 位 指示 引用 GDT 表 
中 的 描述 符 ,还 是 LDT 表 中 的 描述 符 。 示 例 三 演示 局 部 描述 符 表 LDT 的 使 用 ,同时 演示 段 
间 子 程序 的 调用 。 

1. 执行 步 双 

示例 三 的 逻辑 功能 是 ,先后 两 次 显示 某 个 代码 段 描 述 符 的 属性 值 : 第 一 次 的 属性 值 是 在 
执行 对 应 代码 段 之 前 ; 第 二 次 的 属性 值 是 之 后 。 属 性 值 采 用 十 六 进 制 数 表示 。 

示例 三 的 主要 执行 步骤 如 下 。 

(1) 实 方式 下 的 初始 化 。 除 了 像 示 例 二 那样 初始 化 GDT 表 中 的 部 分 描述 符 外 ,还 初始 化 
LDT 表 的 描述 符 。 之 后 ,装载 全 局 描述 符 表 寄 存 器 GDTR。 建 立 的 GDT 表 含 有 描述 LDT 表 
的 描述 符 。 任 务 使 用 的 大 部 分 描述 符 ,被 安排 在 LDT 表 中 。 

(2) 从 实 方式 切换 到 保护 方式 ,进入 临时 代码 段 T。 代 码 段 是 一 个 16 位 代码 段 。 

(3) 装载 局 部 描述 符 表 寄 存 器 LDTR。 

(4) 设置 堆栈 指针 ,建立 完全 属于 工作 任务 的 堆栈 。 

(5) 从 临时 代码 段 工 跳 转 到 演示 代码 段 D。 代 码 段 D 是 一 个 32 位 代码 段 ,而 且 属 于 工作 
任务 ,其 描述 符 在 LDT 表 中 。 

(6) 第 一 次 取得 子 程序 代码 段 P 描述 符 中 的 属性 值 ,并 显示 属性 值 。 在 把 属性 值 转换 成 
对 应 十 六 进 制 数 ASCII 码 串 后 ,采用 直接 写 屏 方式 显示 含有 属性 值 的 字符 串 信息 。 

(7) 第 二 次 取得 子 程序 代码 段 P 描述 符 中 的 属性 值 ,并 显示 。 由 于 之 前 已 经 执行 过 代码 
段 P 中 的 代码 ,因此 属性 值 的 访问 位 A 位 将 有 变化 。 





(8) 从 演示 代码 段 D 跳 转 到 临时 代码 段 工 。 
(9) 从 保护 方式 切换 到 实 方式 。 

2. 源 程序 

实现 上 述 步骤 的 示例 三 源 程序 dp93. asm 如 下 : 
;演示 局 部 描述 符 表 LDT 的 使 用 ( 示例 三 ,d83) 


% include  ”DVMCH" 文件 CH 含有 宏 的 声明 和 符号 常量 等 
section text 段 text 
bits 16 ;6 位 段 模式 

Head: ;工作 程序 特征 信息 
HEADER end_of_text, Begin, 2000H 

GDTSeg: ;全 局 描述 符 表 GOT 

Dumy DESCRIPTIR 00000 

Normal DESCRIPTOR FFFFHOOATIW0 

Nomal_Sel eq Nomal- GDTSeg 

IniteDT: :gpT 中 待 初始 化 描述 符 起 点 


;局 部 描述 符 表 LDT 段 的 描述 符 及 其 选择 子 
LDTable DESCRIPTOR LerLDT- 1LDTSeg 0 ATLDT,O 
LDT_Sel eq LDTable- GDTSeg 
;6 位 代码 段 T 的 描述 符 及 其 选择 子 
CodeT DESCRIPTOR ”OFFFFH CodeTSeg 0ATCERR .0 
CodeT Sel equ Codel- GDTSeg 
NnDescG eq ($- InitoT) /8 :00T 中 需 初始 化 的 描述 符 个 数 
LentpT equ $- GDTSeg 
alin 16 ;16 字 节 对 齐 
LDTSeg: ;局 部 描述 符 表 LDT 
;2 位 代码 段 0 的 描述 符 及 其 选择 子 
CodeD DESCRIPTOR ”Len0odeD- 1, CodeDSeg, 0. ATCE32.0 
CodeD Sel eq (CodeD-LDTSeg)+ TIL 
;2 位 代码 段 P 的 描述 符 及 其 选择 子 
Codep DESCRIPTOR ”Len0odeP- 1, CodePSeg, 0. ATCE32. 0 
Codep Sel eq (Codep-LDTSeg)+TIL 
;LDT 别 名 有 段 ( 作为 数据 段 ) 的 描述 符 及 其 选择 子 


ADT DESCRIPTOR «LerlDT- 1,LDTSeg OAIDR0 
ADT Sel eq (ADT-LDTSeg)+TIL 

激 据 缓冲 区 段 的 描述 符 及 其 选择 子 

DBuff DESCRIPTOR ”LerDBuff- 1.DBSeg OAIDW 0 
DBuff Sel eq (DBuff- LDTSeg)+TIL 

;堆栈 段 的 描述 符 及 其 选择 子 


StackS DESCRIPTOR ”BoStacke- 1, StackSeg, 0. ATDNS2. 0 
Stack Sel eq (StackS- LDTSeg)+ TIL 

Nnbesd. em ($-LDTSeg) /8 ;DT 中 需 初始 化 的 描述 符 个 数 
;视频 存储 区 段 的 描述 符 及 其 选择 子 

Videdem DESCRIPTOR CFFFFH O00 CFOH: AIW0 

Wen Sel eq (Videclem LDTSeg)+TIL 
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LerLDT eq $-LDTSeg :DT 的 长 度 
数据 缓冲 区 段 ( 用 于 存放 显示 输出 信息 ) 
alin 16 ;16 字 节 对 齐 
DBSeg: ;缓冲 区 起 始 位 置 
Message eq $-DBseg ;: 段 内 偏 移 
中 'Attributes='， 
Buffer eq $- DBSseg 上 段 内 偏 移 Ma1 
中 '00H',0 
LerpBuff eq $- DBseg 
江 作 任务 的 堆栈 段 
alimn 16 :16 字 节 对 齐 
StackSeg: ;堆栈 顶 位 置 


BoStack equ $-StackSeg ;堆栈 底部 的 段 内 偏 移 //@2 


:工作 任务 的 代码 段 RR 匀 位 段 ) ( 包含 远 过 程 叫 和 B, 还 有 近 过 程 攻 


alim 16 ;16 字 节 对 齐 

bits 2 ;2 位 段 模式 
CodePSeg: ;代码 段 P 的 起 始 位 置 
浮 程 序 W 远 过 程 ) 


泄 能 : 显示 输出 字符 串 
;入 口 参 数 : FS:ESI 指向 字符 串 ( 以 0 结尾 ) 


;ES:EX 指向 显示 起 始 位 置 

DisbWess equ $- CodepSeg 浮 程序 吸 的 段 内 偏 移 
WY AX Wem Sel 
W ES MX 闫 用 于 视频 存储 区 段 
WY EI, (B8000H ;视频 存储 区 的 起 始 
ADD EI, EX ;实际 起 始 显 示 位 置 /@3 
WW AH 4 江 底 白字 

.LIWMOV AL [FS:ESD ; 取 字 符 
INC ESI 
R LA 学 符 串 以 0 结尾 
区 :县 
MX [ES:D], MX 汗 视 频 存储 区 ( 显示 ) 
AD EI, 2 
JP SHORT .LI 

.L2:RETF ; 远 返 回 ( 段 间 返回 ) 

; 池 程 序 & 远 过 程 ) 


功 能 : 16 位 二 进 制 值 转换 成 对 应 十 六 进 制 数 Ascll 串 
;人口 参数 : 鸣 含 二 进 制 值 
; FS:ESI 指向 缓冲 区 首 
BIHStr eq $- Codepseg 浮 程 序 B 的 段 内 偏 移 Me 4 

MY EX 4 ;46 位 二 进 制 对 应 4 位 十 六 进 制 
NextH: 

RL DX 4 ;循环 左 移 4 位 





CAL HTASCII ;转换 成 ASCI1 码 
MXV [FS:ESD, AL ;依次 保存 


汪 程 序 K 近 过 程 ) 

汉 能 : 把 一 位 十 六 进 制 数 转换 成 对 应 字符 的 ASCN 码 
;入口 参数 : 人 L 低 4 位 含 十 六 进 制 数 

;出 口 参 数 : 名 含 对 应 字符 的 ASCI 码 


HIASCI1: ; 池 程 序 H 的 入 口 
AD A, OH 
AD A, 30H 
OP A MH 
JEE $+4 
AD 人 L 7 
FET ;: 近 返回 
Len0odep equ $- Codepseg ;代码 段 P 的 长 度 
;工作 任务 的 演示 代码 段 D( 也 位 段 ) 
align16 ;16 字 节 对 齐 
bits 2 ;2 位 段 模式 
CodeDSeg: ;代码 段 0 的 起 始 位 置 
CD_Entry equ$- CodeDSeg ;入 口 点 的 段 内 偏 移 
MV AX ADT Sel 把 UT 作 为 数据 的 别名 段 的 
MV GS 人 ;描述 符 选择 子 装 和 人 G 
MY EEX, CodeP ATTRI- LDTSeg ;代码 段 P 描 述 符 中 属性 域 的 偏 移 Ma6 
WY DX [GS:EBM 第 1 次 取得 代码 段 P 的 属性 值 
MO AX DBuff_Sel 
MV FS 从 ;把 数据 缓冲 区 段 描述 符 选择 子 装 入 FS 
MX ESI, Buffer 指向 缓冲 区 首 
CALL Codep_Sel:BTHStr ;二 进 制 值 转换 成 对 应 十 六 进 制 数 ASoll 码 串 
MN ESI, Message 指向 待 显示 字符 串 首 
MY EX St 160 ;显示 位 置 ( 第 5 行 首 ) 
CAL CodeP _Sel:DisbWess ;显示 属性 值 信息 
MY DX [GS:EBX] ;第 2 次 取得 代码 段 P 的 属性 值 
MN ESI, Buffer 指向 缓冲 区 首 
CAL Codep_Sel :BTHStr ;二 进 制 值 转换 成 对 应 十 六 进 制 数 AS0Il 码 串 
WN ESI, Message 指向 待 显示 字符 串 首 
MV EX 6 10 ;显示 位 置 ( 第 6 行 首 ) 


CALL CodeP Sel:DisbWess :显示 属性 值 信息 
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L3: JWP ”CodeT_Sel:CT_Frtry2 ; 跳 转 到 代码 段 K 
Len0odeD equ $- CodeDseg 
:临时 代码 段 T 
align16 ;16 字 节 对 齐 
bits 16 :2 位 段 模式 
CodeTSeg: ;代码 段 T 的 起 始 位 置 
CT_Entryl equ，$- CodeTSeg ;人 口 1 的 段 内 偏 移 
MY AX IDT sel 
UDT 尽 ;装载 DR 寄存 器 /@7 
MY AX Stack_Sel 
MNV SS AX ;建立 工作 任务 自己 的 堆栈 
MN ESP BoStack 


束 吝 豆 豆 豆 豆 豆 划 豆 
多 
二 


CRO EX 


跳 转 到 演示 代码 段 D 

;入 口 2 的 段 内 偏 移 

;准备 返回 实 方式 

把 规范 段 描 述 符 装 入 段 寄存 器 


;准备 切换 回 实 方式 


真正 进入 实 方式 ,到 达 Real 处 
JP FAR [CS ToReal- CodeTSeg ] 


ToReal ;返回 到 实 方式 的 地 址 
dn Real ; 偏 移 部 分 ,6 位 方式 , 偏 移 仅 6 位 
dn 0 : 段 值 部 分 ,需要 重新 定位 


align16 ;16 字 节 对 齐 
bits 16 ;也 位 段 模式 
VDR PDESC Leneor-10 ;DT 伪 描述 符 
VarEsp DD 0 淘 存 实 方式 的 堆栈 指针 
Varss Wo 
TobodeT DN CT_Entry1 ;代码 段 T 入 口 点 Ertry 偏 移 
DW CodeT_ Sel ;代码 段 T 选 择 子 
Begin 实 方式 的 代码 





[VarESP], ESP 


箱 定 位 ,设置 段 值 Me8 
:保存 实 方式 下 堆栈 指针 


指向 需要 初始 化 的 首 个 描述 符 


;需要 初始 化 的 描述 符 个 数 
;初始 化 @T 表 中 的 部 分 描述 符 


指向 LIT 中 需要 初始 化 的 首 个 描述 符 


沐 数 
;初始 化 UDT 表 中 的 部 分 描述 符 


指向 伪 描 述 符 


;指向 @T 表 
浏 始 化 伪 描 述 符 


;装载 IR 
;准备 切换 到 保护 方式 


;进入 保护 方式 下 的 代码 段 T 


; 回 到 实 方式 


恢复 实 方式 下 的 堆栈 指针 


开 中 断 


3. 子 程序 文件 


为 了 节省 篇 幅 , 也 为 了 提高 工作 效率 ,把 实 方式 下 初始 化 阶段 运行 的 几 个 子 程序 
个 子 程序 文件 中 ,本 章 的 示例 大 部 分 都 要 使 用 到 这 


如 下 : 


; 源 文 件 : PROC AS 
;保护 方式 编程 初始 化 阶段 的 子 程序 
InitDescBA: 
:根据 存储 段 的 当前 位 置 的 段 值 和 偏 移 ,设置 描述 符 的 也 位 基地 址 
;DS:SI 指向 首 个 描述 符 , 以 含有 待 初始 化 描述 符 的 个 数 

.Next: 


WW MXC 


;包含 初始 化 阶段 的 相关 子 程序 
源 程序 到 此 为 止 


从 上 述 源 程 序 可 知 ,不 仅 包含 了 头 文件 DMC. H, 还 包含 了 通用 子 程序 文件 PROC. ASM。 


当前 代码 段 值 


些 子 程序 。 这 个 子 程序 文件 PROC. ASM 
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MY DX 16 
ML mx ;DX:AE 当前 代码 段 的 基地 址 
AD AM [Si 了 习 :加 上 描述 符 中 预 置 的 起 始 地 址 
Ac 以 0 ;DX:AE 对 应 存储 段 的 习 位 基地 址 
MV [SI+2, MX ;填写 段 基地 址 (位 0 休 
MV [SI+ 司 , DL ;填写 段 基地 址 (位 16 29) 
MNV [SI+, DH ;填写 段 基地 址 (位 2 31) 
AD SI,8 下 一 个 描述 符 
LOOP .Next 
RET 

InitPeDesc: 


;设置 用 于 GDIR 或 者 IDIR 的 伪 描 述 符 
;DS:SI 指向 伪 描 述 符 变量 , 欧 指 向 对 应 的 描述 符 表 首 
WW MX Cs 
WW DMX 16 
ML DX :DX: 以 含 当前 代码 段 基地 址 
AD MX BX 
Ac 以 0 ;DX: 信 指向 @T 伪 描述 符 
MV [SI+2], AX ;填写 到 伪 描 述 符 变 量 
WY [SI+4], MX 


4. 内 存 映像 

图 9. 15 给 出 了 本 示例 运行 时 的 部 分 内 存 映 像 示意 图 。 从 图 中 可 见 全 局 描述 符 表 GDT 
和 局 部 描述 符 表 LDT。 在 GDT 表 中 ,含有 一 个 描述 LDT 表 的 系统 段 描述 符 ,在 9. 6.1 节 对 
LDT 有 段 描述 符 有 更 详细 介绍 。 为 了 简洁 ,除了 LDT 描述 符 外 ,没有 画 出 其 他 描述 符 与 对 应 段 
基地 址 的 关系 。 

5. 关于 执行 步 又 的 注释 

本 示例 依旧 简单 化 处 理 , 没 有 建立 中 断 描述 符 表 IDT, 也 没有 启用 分 页 存储 管理 机 制 , 特 
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权 级 保持 在 0 级 。 下 面 对 执 行 步骤 作 些 说 明 ,与 之 前 示例 相同 部 分 就 不 袭 述 。 
(1) GDT 和 LDT 的 初始 化 。 本 示例 安排 了 局 部 描述 符 表 LDT, 它 包含 本 示例 使 用 的 大 
为 了 简便 ,各 描述 符 内 的 段 界限 和 属性 值 在 定义 时 预 置 。 从 段 界限 中 可 知 ,除了 Normal 
描述 符 、 代 码 段 描述 符 CodeT 和 视频 存储 区 描述 符 VideoMem 外 ,其 他 描述 符 都 按 段 的 实 
际 长 度 设置 了 段 界限 。 从 段 属性 可 知 , 代 码 段 D 和 代码 段 P 都 是 32 位 代码 段 ,还 有 堆栈 段 也 
是 32 位 段 。 





实 方式 下 执行 的 代码 和 数据 
代码 段 T 
代码 段 D 
代码 段 P 
堆栈 段 
数据 缓冲 区 段 
视频 存储 区 描述 符 VideoMem 
堆栈 段 描述 符 StackS 
数据 缓冲 区 段 描述 符 DBuff 
别名 数据 段 描述 符 ALDT 
代码 段 P 描 述 符 CodeP 
代码 段 D 描 述 符 CodeD LE 
代码 段 T 描 述 符 CodeT 





-| 


LDT 




















LDT 拱 述 符 GD 
规范 描述 符 
三 描述 符 1 
工作 程序 特征 信息 
000xxxx0 





9.15 示例 三 的 部 分 内 存 映像 示意 图 


与 示例 二 相同 ,在 定义 描述 符 时 , 待 初始 化 描述 符 的 段 基地 址 低 16 位 字段 在 定义 时 预 置 
了 段 的 起 始 地 址 ,该 起 始 地 址 是 在 整个 目标 代码 中 的 相对 偏 移 。 这 样 安排 后 ,把 整个 目标 代码 
在 内 存 的 起 始 地 址 (也 即 初 始 化 时 当前 代码 段 的 段 值 乘 上 16), 加 上 预 置 的 相对 偏 移 , 就 得 到 
这 些 段 的 段 基地 址 。 为 了 简便 ,采用 子 程序 分 别 对 GDT 表 和 LDT 表 中 的 这 些 描 述 符 设置 段 
基地 址 。 

顺便 说 一 下 ,由 于 本 示例 没有 使 用 到 地 址 位 于 1MB 以 上 的 存储 区 域 ,因此 无 须 打 开 和 关 
闭 地 址 线 A20。 

(2) 寄存 器 LDTR 的 装载 。 在 使 用 LDT 表 之 前 ,需要 装载 局 部 描述 符 表 寄 存 器 LDTR。 
本 示例 中 使 用 9. 3. 3 节 介 绍 的 装载 LDTR 寄存 器 指令 LLDT, 参 见 源 程 序 “//@7” 行 。 由 于 
要 引用 GDT 表 , 因 此 不 能 在 实 方式 下 装载 LDTR。 

在 装载 好 LDTR 之 后 ,就 可 以 使 用 其 中 的 描述 符 了 。 为 了 引用 局 部 描述 符 表 LDT 中 的 
描述 符 , 对 应 选择 子 中 的 描述 符 表 指 示 位 TI 必须 是 1, 参 见 源 程序 中 相关 选择 子 的 安排 。 

(3) 堆栈 的 建立 。 本 示例 安排 了 自己 的 堆栈 空间 ,并 且 有 意 把 堆栈 段 描述 符 StackS 安排 
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在 LDT 表 中 。 在 装载 寄存 器 LDTR 之 后 ,设置 堆栈 段 寄存 器 SS, 设 置 堆栈 指针 寄存 器 ESP。 
需要 指出 的 是 ,作为 堆栈 底 初 值 的 BoStack 应 该 是 堆栈 段 内 的 偏 移 , 参 见 源 程序 *“//@2? 行 。 
在 进入 保护 方式 前 ,保存 了 堆栈 指针 。 在 回 到 实 方式 后 ,利用 如 下 指令 恢复 原 堆 栈 指针 。 
LSS ”ESP [VarESP] 

上 述 一 条 指令 的 功能 , 优 于 以 下 两 条 指令 的 功效 。 
MX Esp, [VarESP] 
MY SS, [VarESp+ | MN SS, [varss] 

(4) 逻辑 功能 的 实现 。 在 32 位 代码 段 D 中 实现 逻辑 功能 。 为 此 ,先后 两 次 通过 别名 技术 
访问 局 部 描述 符 表 LDT 段 , 读 取代 码 段 P 描述 符 的 属性 值 。 值 得 指出 的 是 ,对 应 存储 单元 的 
地 址 应 该 是 LDT 段 内 的 偏 移 , 参 见 源 程序 "//@6” 行 。 

通过 如 下 段 间 调 用 指令 ,调用 代码 段 P 中 的 子 程序 B, 把 取得 的 属性 值 转换 成 对 应 十 六 进 
制 数 的 ASCII 码 串 。 

CAL Codep Sel:BTHStr 

由 于 该 指令 在 32 位 代码 段 中 ,因此 采用 48 位 的 指针 。 其 中 ,BTHStr 表示 子 程序 的 入 口 
点 ,是 代码 段 P 内 的 偏 移 , 因 此 是 一 个 差 值 ,参见 源 程序 “//@4” 行 。 注 意 , 它 自 己 调用 子 程序 
HTASCII 是 段 内 调用 ,由 入 口 标号 表示 入 口 点 。 

类 似 地 ,通过 如 下 段 间 调用 指令 ,调用 代码 段 P 中 的 子 程序 DM, 采 用 直接 写 屏 的 方式 显 
示 含 有 属性 值 的 字符 串 信息 。 

CAL CodeP_Sel:DispMess 

由 于 第 一 次 取得 代码 段 P 描述 符 的 属性 值 是 在 执行 代码 段 P 的 代码 之 前 ,第 二 次 是 在 执 
行 之 后 ,因此 属性 中 的 访问 位 A 位 会 有 变化 。 

(5) 工作 方式 的 切换 。 实 方式 和 保护 方式 之 间 的 切换 方法 没 变 ,在 调整 CRO 中 的 PE 位 
后 ,执行 一 条 段 间 转移 指令 完成 真正 的 切换 。 但 是 ,为 了 充分 演示 ,刻意 安排 了 段 间 间接 转移 
指令 ,而 非 段 间 直 接 转移 指令 。 进 入 保护 方式 的 指令 如 下 ,其 中 FAR 表示 远 转 移 ,也 即 段 间 
转移 : 

JP FR [ToCodeT] 

从 源 程序 可 见 ,变量 ToCodeT 含有 代码 段 工 的 入 口 地 址 。 其 中 ,CodeT_Sel 是 代码 段 工 
的 选择 子 ,CT_Entryl 是 代码 段 工 内 的 偏 移 。 

类 似 地 , 回 到 实 方式 的 段 间 间 接 转移 指令 如 下 : 

JWP FMR [CS ToReal- CodeTSe& | 

其 中 ,表达 式 “ToReal-CodeTSeg” 表 示 标 号 ToReal 处 存储 单元 在 代码 段 内 的 偏 移 。 
由 于 数据 段 寄 存 器 DS 不 含 代码 段 的 选择 子 , 因 此 需要 采用 段 超越 前 级 的 形式 ,事实 上 , 代 
码 段 是 可 读 的 代码 段 ,参见 描述 符 中 的 属性 值 ATCER 。 

从 源 程 序 可 见 , 标 号 ToReal 处 安排 了 由 选择 子 和 16 位 偏 移 组 成 的 实 方式 返回 点 的 地 
址 。 其 中 , 段 值 部 分 需要 重 定位 ,因为 只 有 在 运行 时 才能 确定 最 终 的 段 值 。 在 示例 程序 运行 之 
初 ,进行 了 重 定位 操作 ,参见 源 程序 “//@7” 行 。 由 于 采用 间接 转移 指令 ,因此 这 里 的 重 定 位 没 
有 修改 指令 机 器 码 。 

6. 别名 技术 

在 本 示例 中 ,使 用 了 两 个 描述 符 来 描述 LDT 段 。 描 述 符 LDTable 被 安排 在 GDT 表 中 ， 
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它 是 一 个 系统 段 描述 ,把 段 LDTSeg 描述 成 局 部 描述 符 表 LDT。 另 一 个 描述 符 ALDT 被 安 
排 在 LDT 表 中 , 它 是 一 个 数据 段 描 述 符 , 把 段 LDTSeg 描述 成 一 个 普通 的 数据 段 。 描 述 符 
LDTable 被 装载 到 寄存 器 LDTR ,描述 符 ALDT 被 装载 到 某 个 数据 段 寄 存 器 。 为 什么 要 这 样 
处 理 呢 ? 为 了 实现 本 示例 的 逻辑 功能 ,需要 访问 局 部 描述 符 表 LDT 段 , 以 取得 代码 段 P 的 属 
性 值 , 这 需要 通过 某 个 段 寄 存 器 进行 ,但 不 能 把 系统 段 描述 的 选择 子 装载 到 段 寄存 器 ,所 以 采 
用 两 个 描述 符 来 描述 同一 个 段 LDTSeg。 

这 种 为 了 满足 对 同一 个 段 实 施 不 同方 式 操作 的 需要 ,而 用 多 个 描述 符 加 以 描述 的 技术 称 
为 别名 技术 。 这 好 比 一 个 演员 在 一 部 戏 中 扮演 多 个 角色 ,在 不 同 的 情景 下 ,使 用 不 同 的 称呼 。 
在 保护 方式 程序 设计 中 ,常常 要 采用 别名 技术 。 例 如 ,用 两 个 具有 不 同类 型 值 的 描述 符 来 描述 
同一 个 段 。 又 如 ,用 两 个 具有 不 同 DPL 的 描述 符 来 描述 符 同一 个 段 。 


9.5 分 页 存储 管理 机 制 


分 段 存储 管理 机 制 实现 逻辑 地 址 到 线性 地 址 的 转换 ,分 页 存储 管理 机 制 实现 线性 地 址 到 
物理 地 址 的 转换 。 利 用 分 页 存储 管理 机 制 , 操 作 系统 可 以 实现 虚拟 存储 器 。IA-32 系列 CPU 
支持 多 种 分 页 方式 ,本 节 介 绍 最 初 的 .最 简单 的 分 页 方式 ,也 即 页 尺寸 统一 为 4KB 的 分 页 
方式 。 


9.5.1 存储 分 页 


控制 寄存 器 CR0 中 的 最 高 位 PG 位 决定 是 否 启用 分 页 存储 管理 机 制 。 如 果 PG=1, 启 用 
分 页 机 制 ,把 线性 地 址 转换 为 物理 地 址 ; 如 果 PG 二 0, 关 闭 分 页 机 制 ,这 样 线性 地 址 就 直接 作 
为 物理 地 址 了 ,请 参见 图 9. 1。 必 须 注意 ,只 有 在 保护 方式 下 才 可 启用 分 页 存储 管理 机 制 。 也 
就 是 说 ,只 有 在 CR0 的 最 低位 PE 位 为 1 的 前 提 下 ,才能 够 使 PG 位 为 1, 否则 将 引起 通用 保护 
异常 ,请 参见 表 9. 2。 

基于 线性 地 址 空间 到 物理 地 址 空间 的 页 映射 ,分 页 存储 管理 机 制 实现 线性 地 址 到 物理 的 
转换 。 如 9. 1. 1 节 所 述 ,分 页 机 制 把 线性 地 址 空间 划分 为 尺寸 固定 的 线性 页 ,把 物理 地 址 空间 
也 划分 为 对 应 尺寸 的 物理 页 。 线 性 页 与 物理 页 之 间 的 映射 关系 ,可 根据 需要 而 确立 ,可 根据 需 
要 而 改变 。 图 9. 16 示意 了 在 两 个 地 址 空间 中 部 分 页 之 间 的 映射 关系 。 线 性 地 址 空间 中 的 某 
一 页 ,可 以 映射 到 物理 地 址 空间 中 的 任何 一 页 ; 线性 地 址 空间 中 的 某 一 页 ,也 可 以 并 不 映射 到 
物理 地 址 空间 ; 线性 地 址 空间 中 的 多 个 页 ,还 可 以 映射 到 物理 地 址 空间 中 的 同一 页 。 
启用 分 页 存储 管理 机 制 的 主要 目的 是 便于 实现 虚拟 存 
| 储 器 。 只 有 在 需要 的 时 候 , 才 把 线性 地 址 空间 的 页 映射 到 
| 物理 地 址 空间 ,或 者 说 ,只 有 在 需要 的 时 候 , 才 给 线性 页 分 
一 配 物理 页 。 这 样 ,物理 存储 器 的 容量 可 以 远 小 于 线性 地 址 
1 
1 




















空间 的 容量 。 

| 可 以 简单 认为 ,页 的 尺寸 是 4KB。 在 IA-32 系列 CPU 
中 ,这 是 最 简单 情形 ,最 初 只 支持 这 种 基本 情形 。 实 际 上 ， 
现在 CPU 还 支持 4MB 的 页 ,甚至 4KB 的 页 与 4MB 的 页 同 


线性 地 址 空间 。 物理 地 址 空间 。 时 存在 ; 还 可 以 支持 2MB 的 页 。 限 于 篇 幅 , 只 介绍 4KB 页 
图 9.16 页 与 页 之 间 的 映射 示意 图 的 情形 
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页 的 起 始 地址 以 页 的 尺寸 对 齐 。 所 以 ,4KB 的 页 ,页 的 边界 地 址 是 4KB 的 倍数 。4GB 的 
地 址 空间 被 划分 为 1M 个 页 。 

在 最 简单 情形 下 ,采用 十 六 进 制 表 示 ,每 页 的 起 始 地 址 具有 XXXXX000 的 形式 。 为 了 便 
于 表述 ,把 页 起 始 地 址 的 高 位 部 分 称 为 页 码 , 由 页 码 指定 页 。 当 页 的 尺寸 为 4KB 时 ,页 码 是 页 
起 始 地 址 的 高 20 位 ,也 即 上 述 的 XXXXX 部 分 。 线 性 地 址 空间 到 物理 地 址 空间 的 页 映射 关 
系 , 可 以 由 LLLLL 页 到 PPPPP 页 的 映射 来 表示 。 


9.5.2 线性 地 址 到 物理 地 址 的 转换 


1. 映射 表 结构 

在 最 简单 情形 下 ,页 的 尺寸 统一 为 4KB, 页 的 边界 是 4KB 的 倍数 ,在 把 32 位 线性 地 址 转 
换 成 32 位 物理 地 址 的 过 程 中 ,地 址 的 低 12 位 保持 不 变 。 也 就 是 说 ,物理 地 址 的 低 12 位 等 于 
线性 地 址 的 低 12 位 。 若 采用 十 六 进 制 表示 ,假设 线性 地 址 空间 的 LLLLL 页 映射 到 物理 地 址 
空间 的 PPPPP 页 ,那么 线性 地 址 LLLLLabe 转换 成 为 物理 地 址 PPPPPabc。 

分 页 存储 管理 机 制 采用 映射 表 的 方式 来 登记 线性 页 到 物理 页 的 映射 关系 。4GB 地 址 空 
间 被 划分 为 1M 个 页 ,如 果 用 一 张 表 来 登记 这 种 映射 关系 ,那么 这 张 映 射 表 需 要 有 1M 个 表 
项 ,如 果 每 个 表 项 占用 4 个 字 节 ,那么 该 映射 表 就 要 占用 4MB。 为 避免 映射 表 占 用 如 此 多 的 
存储 资源 ,所 以 把 页 映射 表 分 为 页 目录 和 页 表 两 级 。 

页 映射 表 的 第 一 级 称 为 页 目录 (Page Directory) ,存放 在 一 个 4KB 的 物理 页 中 。 页 目录 
共有 1K 个 表 项 (Page-Directory Entry) ,每 个 PDE 表 项 4 字 节 长 ,由 它 指定 存在 的 页 表 所 在 
物理 页 的 页 码 。 页 映射 表 的 第 二 级 称 为 页 表 (Page Table) ,每 张 存 在 的 页 表 占 用 一 个 4KB 的 
页 。 每 张 页 表 都 有 1K 个 表 项 (Page-Table Entry) ,每 个 PTE 表 项 4 字 节 长 ,由 它 指 定 线性 页 
所 对 应 物理 页 的 页 码 。 图 9. 17 给 出 了 由 页 目录 和 页 表 构 成 的 页 映射 表 结构 。 

从 图 9. 17 可 知 ,控制 寄存 器 CR3 指定 页 目录 ; 页 目录 可 以 指定 1K 张 页 表 , 其 中 存在 的 
页 表 可 以 分 散 存 放 在 任意 的 物理 页 中 ,而 不 需要 连续 存放 ; 每 张 页 表 可 以 指定 1K 个 物理 页 ， 
理论 上 这 些 物理 页 可 以 任意 地 分 散在 物理 存储 器 中 。 

2. 表 项 格式 

在 最 简单 情形 下 ,页 目录 的 表 项 PDE 和 页 表 中 的 表 项 PTE 的 格式 如 图 9. 18 所 示 。 从 图 
中 可 知 , 最 高 20 位 (位 12 至 位 31) 是 物理 地 址 空间 页 的 页 码 , 也 就 是 物理 地 址 的 高 20 位 。 
PDE 的 低 12 位 包含 对 应 页 表 的 属性 .PTE 的 低 12 位 包含 对 应 物理 页 的 属性 。 

在 图 9. 18 所 示 PDE 和 PTE 的 属性 中 多 个 位 被 标记 为 X, 这 些 位 有 各 自 的 含义 ,为 了 节 
省 篇 幅 , 略 去 相关 介绍 ,在 使 用 时 采用 0 值 即 可 。 另 外 ,位 9 至 位 11 的 Avail 字段 可 供 操作 系 
统 使 用 。 

从 图 9. 18 可 知 ,PDE 和 PTE 表 项 的 最 低位 是 属性 位 P, 也 被 称 为 存在 (Present) 标 记 。 
P=1 表 项 有 效 ,对 应 的 页 表 或 者 物理 页 存在 ,可 以 根据 表 项 内 容 进行 线性 地 址 到 物理 地 址 的 
转换 ; P= 二 0 表 项 无 效 , 对 应 的 页 表 或 者 物理 页 不 存在 。 在 通过 页 目录 和 页 表 进 行 线性 地 址 到 
物理 地 址 的 转换 过 程 中 ,无 论 在 页 目录 或 页 表 中 遇 到 无 效 表 项 ,都 会 引起 页 故障 。 其 他 属性 位 
的 作用 在 下 一 小 节 中 介绍 。 

3. 线性 地 址 到 物理 地 址 的 转换 

分 页 存储 管理 机 制 通过 上 述 页 目录 和 页 表 实 现 线性 地 址 到 物理 地 址 的 转换 。 实 则 是 把 线 
性 地 址 空间 的 页 LLLLL 转换 到 物理 地 址 空间 的 页 PPPPP。 
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物理 页 的 页 码 Avail |X|Ix|IDIAIxXIx|/|/|IPr 
SIW 
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9.18 页 目录 表 项 和 页 表 的 表 项 格式 


如 前 所 述 ,控制 寄存 器 CR3 指定 了 页 目录 ,页 目录 和 页 表 均 由 1K 个 表 项 组 成 ,使 用 10 位 
就 能 指定 对 应 的 表 项 。32 位 线性 地 址 转换 到 32 位 物理 地 址 的 过 程 是 : 首先 ,把 线性 地 址 的 最 
高 10 位 (即位 22 至 位 31) 作 为 页 目录 的 索引 ,由 对 应 表 项 PDE 所 包含 的 页 码 指定 页 表 ; 然 
后 ,把 线性 地 址 的 中 间 10 位 (即位 12 至 位 21) 作 为 已 指定 页 表 的 索引 ,对 应 表 项 PTE 所 包含 
的 页 码 指定 物理 地 址 空间 中 的 物理 页 ; 最 后 ,把 已 指定 物理 页 的 页 码 作为 高 20 位 ,把 线性 地 
址 的 低 12 不 加 改变 直接 作为 低 12 位 ,形成 32 位 物理 地 址 。 图 9. 19 是 线性 地 址 到 物理 地 址 
的 转换 示意 图 ,其 中 采用 十 六 进 制 数 表示 起 始 地 址 、 页 码 、 偏 移 和 属性 等 。 


【 例 9-17〗 假设 启用 分 页 存储 管理 机 制 ,CR3 的 内 容 是 00200000H ,部 分 页 目录 表 项 
PDE 和 对 应 的 部 分 页 表 表 项 PTE 如 图 9. 20 所 示 ,其 中 刻意 把 页 表 1 安排 在 较 低 的 位 置 。 那 
么 ,线性 地 址 00402567H 被 转换 成 物理 地 址 00303567H。 
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9.19 线性 地 址 到 物理 地 址 的 转换 示意 图 





















00303000H 
| 
00301000H 
| 
000B8007H 
002023COH 
00301001H 
002022EOH 
00000003H 
一 00202000H 页 表 0 
00303001H 






00201008H 
00201000H 页 表 1 


00201003H 
00200004H 


00202003H 
上 一 一 上 oo200000H 页 目录 表 














一 000B8000H 
本 物理 地 址 








图 9.20 页 目录 和 页 表 的 一 个 示例 


地 址 转换 过 程 是 : 由 CR3 得 到 页 目录 表 的 基地 址 是 00200000H ,线性 地 址 00402567H 的 
高 10 位 是 001H ,作为 页 目录 中 的 索引 ,因此 对 应 表 项 PDE 的 物理 地 址 是 00200004H; 从 该 
PDE 得 到 页 表 所 在 物理 页 的 页 码 是 00201H ,也 即 页 表 所 在 物理 页 的 基地 址 是 00201000H , 线 
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性 地 址 的 中 间 10 位 是 002H, 作为 页 表 中 的 索引 ,因此 对 应 表 项 PTE 的 物理 地 址 是 
00201008H; 从 该 PTE 得 到 物理 页 的 页 码 是 00303H; 线性 地 址 的 低 12 位 是 567H ,直接 作为 
物理 地 址 的 低 12 位 ,因此 得 物理 地 址 是 00303567H 。 

【 例 9-18〗 基于 例 1 的 假设 ,线性 地 址 000F0123H 被 转换 成 物理 地 址 000B8123H; 线性 
地 址 00000987H 被 转换 成 物理 地 址 00000987H ,与 线性 地 址 相同 。 

4. 不 存在 的 页 表 

采用 如 图 9. 17 所 示 结 构 的 页 映射 表 , 存 放 全 部 1K 张 页 表 需 要 4MB, 此 外 还 需要 4KB 用 
于 存放 页 目录 表 。 这 样 的 两 级 页 映射 表 似 乎 反而 要 比 单一 的 整 张 页 映射 表 多 占用 4KB。 其 
实 不 然 ,事实 上 不 需要 在 内 存 中 存放 完整 的 两 级 页 映射 表 。 两 级 页 映射 表 结 构 中 对 于 线性 地 
址 空间 中 不 需要 的 或 未 使 用 的 部 分 不 必 分 配 页 表 。 除 了 必须 给 页 目录 分 配 物理 页 之 外 , 仅 当 
在 有 需要 时 才 给 页 表 分 配 物理 页 ,所 以 分 配给 页 表 的 物理 页 也 远 少 于 4MB。 

综 上 所 述 ,页 目录 项 PDE 中 的 存在 标记 了 表明 对 应 的 页 表 是 否 存 在 。 只 有 当 P=1, 才 可 
利用 它 进 行 地 址 转换 ; 否则 ,将 引起 页 故障 。 因 此 ,页 目录 项 PDE 中 的 标记 P 使 得 操作 系统 
只 要 给 当前 实际 使 用 的 线性 地 址 范围 的 页 表 分 配 物理 页 。 


9.5.3 页 级 保护 和 虚拟 存储 器 支持 


在 如 图 9. 18 所 示 的 页 目录 表 项 PDE 和 页 表 表 项 PTE 中 ,安排 了 用 于 页 级 保护 的 属性 位 
和 用 于 支持 虚拟 存储 器 的 属性 位 。 

1. 页 级 保护 

IA-32 系列 CPU 不 仅 提供 段 级 保护 ,也 提供 页 级 保护 。 但 是 ,分 页 存储 管理 机 制 只 区 分 
两 类 特权 级 。 特 权 级 0、1 和 2 统称 为 系统 特权 级 ,特权 级 3 称 为 用 户 特权 级 。 在 如 图 9. 18 所 
示 页 目录 表 项 PDE 和 页 表 表 项 PTE 中 ,属性 位 R/W 和 U/S 用 于 对 页 的 保护 。 

表 项 的 位 1 是 读 / 写 属性 位 , 记 作 R/W。R/W 位 指示 该 表 项 所 指定 的 页 是 否 可 读 、 写 或 
执行 。 如 果 ,R/W=1, 对 表 项 所 指定 页 可 进行 读 、 写 或 执行 ; 如 果 R/W==0, 对 表 项 所 指定 页 
可 读 或 执行 ,但 不 能 对 该 指定 页 写 。 但 是 ,R/W 位 对 页 的 写 保 护 只 在 处 理 器 处 于 用 户 特权 级 
时 发 挥 作用 ; 当 处 理 器 处 于 系统 特权 级 时 ,R/W 位 被 忽略 ,也 即 总 可 以 读 、 写 或 执行 。 

表 项 的 位 2 是 用 户 / 系 统 属性 位 , 记 作 U/S。U/S 位 指示 该 表 项 所 指定 的 页 是 否 是 用 户 
级 页 。 如 果 U/S=1, 表 项 所 指定 页 是 用 户 级 页 ,可 由 任何 特权 级 下 执行 的 程序 访问 ; 如 果 
UV/S=0, 表 项 所 指定 页 是 系统 级 页 ,只 能 由 在 系统 特权 级 下 执行 的 程序 访问 。 

表 9. 3 列 出 了 在 上 述 属 性 位 R/W 和 UV/S 所 确定 的 页 级 保护 下 ,用 户 级 程序 和 系统 级 程 
序 分 别 具 有 的 对 用 户 级 页 和 系统 级 页 进行 操作 的 权限 。 用 户 级 页 可 以 规定 为 只 允许 读 / 执 行 
或 者 规定 为 读 / 写 /执行 。 系 统 级 页 对 于 系统 级 程序 总 是 可 读 / 写 /执行 ,而 对 用 户 程序 级 程序 
总 是 不 可 访问 的 。 外 层 用 户 级 执行 的 程序 只 能 访问 用 户 级 的 页 ,而 内 层 系统 级 执行 的 程序 , 既 
可 访问 系统 级 页 ,也 可 访问 用 户 级 页 。 在 内 层 系统 级 执行 的 程序 ,对 任何 页 都 有 读 / 写 /执行 访 
问 权 , 即 使 规定 为 只 允许 读 /执行 的 用 户 页 ,内 层 系 统 级 程序 也 对 该 页 有 写 访 问 权 。 但 是 , 当 控 
制 寄 存 器 CR0 中 WP 位 被 设置 时 ,内 层 系统 级 程序 不 能 够 对 只 允许 读 /执行 的 用 户 页 进行 写 
操作 。 


表 9.3 页 级 保护 属性 
U/S R/W 用 户 级 访问 权限 系统 级 访问 权限 


第 9 章 保护 方式 程序 设计 :337 








0 0 无 读 / 写 /执行 
0 1 无 读 / 写 /执行 
1 0 读 /执行 读 / 写 /执行 
1 了 读 / 写 / 执 行 读 / 写 /执行 


页 目录 表 项 PDE 中 的 保护 属性 位 R/W 和 U/S, 对 由 该 表 项 指定 页 表 所 指定 的 全 部 1K 
个 页 起 到 保护 作用 。 所 以 ,在 访问 页 时 引用 的 保护 属性 位 R/W 和 U/S 的 值 是 组 合计 算 页 目 
录 表 项 PDE 和 页 表 表 项 PTE 中 的 保护 属性 位 的 值 所 得 。 表 9.4 列 出 了 组 合计 算 前 后 的 保护 
属性 位 值 ,组 合计 算是 “与 ”操作 。 
表 9.4 组合 页 保护 属性 





PDE 中 U/S PTE 中 U/S 组 合 U/S PDE 中 R/W PTE 中 R/W 组 合 R/W 
0 0 0 0 0 0 
0 0 0 1 0 
1 0 0 1 0 0 
1 1 1 1 1 . 


【 例 9-19】〗 假设 某 页 表 的 某 PTE 项 的 R/W=1 和 U/S=1, 表 示 所 指定 物理 页 是 可 由 用 
户 级 程序 读 / 写 /执行 的 用 户 级 页 。 如 果 指 定 该 页 表 的 页 目录 项 PDE 中 的 R/W=0 和 U/S= 
1, 那 么 用 户 级 程序 实际 上 可 对 该 页 的 访问 被 限制 为 读 / 执 行 。 如 果 指 定 该 页 表 的 页 目录 项 
PDE 中 的 R/W==1 和 U/S=0, 那 么 实际 上 用 户 级 程序 没有 对 该 页 的 访问 权 。 

因为 分 页 存储 管理 机 制 在 分 段 存 储 管理 机 制 之 后 起 作用 ,所 以 由 分 页 机 制 支持 的 页 级 保 
护 ,在 由 分 段 机 制 支持 的 段 级 保护 之 后 起 作用 。 在 访问 存储 单元 时 , 先 检测 有 关 的 段 级 保护 ， 
在 检测 通过 后 ,如 果 启 用 分 页 机 制 ,那么 再 检测 页 级 保护 。 

【 例 9-20】 假设 启用 分 页 存储 管理 机 制 ,并 且 当 前 特权 级 是 3。 对 于 一 个 存储 单元 , 仅 当 
其 所 在 段 及 页 都 允许 写 人 时 ,该 存储 单元 才 是 可 写 的 ; 如 果 段 的 类 型 为 读 / 写 ,而 页 规定 为 只 
允许 读 /执行 ,那么 不 允许 写 ; 如 果 段 的 类 型 为 只 读 / 执 行 ,那么 不 论 页 保护 如 何 , 都 不 允许 写 
操作 。 

页 级 保护 的 检查 是 在 线性 地 址 转换 成 物理 地 址 的 过 程 中 进行 的 ,如 果 违 反 页 级 保护 的 规 
定 , 对 页 进行 访问 ( 读 / 写 /执行 ) ,那么 将 引起 页 故障 。 

2. 对 虚拟 存储 器 的 支持 

页 表 项 PTE 中 的 P 位 是 支持 页 式 虚拟 存储 器 的 关键 。 如 前 所 述 , 当 P=1, 表 示 表 项 指定 
的 物理 页 存在 ,并 且 表 项 的 高 20 位 是 物理 页 的 页 码 ; 当 P=0, 表 示 线 性 地 址 空间 中 的 该 页 没 
有 映射 到 物理 地 址 空间 中 的 页 ,或 者 说 不 存在 物理 页 。 如 果 程 序 访问 不 存在 的 页 ,会 引起 页 故 
障 。 操 作 系 统 排除 页 故障 的 大 致 过 程 是 : 首先 分 配 物 理 页 ; 然后 从 磁盘 上 读 入 对 应 的 内 容 到 
物理 页 ; 最 后 更 新 页 表 项 ,使 其 含有 物理 页 的 页 码 且 P 位 置 为 1。 在 操作 系统 排除 页 故障 后 ， 
引起 页 故障 的 程序 可 以 恢复 运行 。 

图 9. 18 所 示 表 项 中 的 访问 位 A 和 写 标 志 位 D 也 用 于 支持 实现 虚拟 存储 器 。PTE 和 
PDE 中 位 5 是 访问 属性 位 , 记 作 A。 在 访问 物理 页 或 者 页 表 时 ,CPU 会 把 对 应 PTE 或 PDE 
中 A 位 设置 为 1, 除非 页 或 者 页 表 不 存在 ,或 者 访问 违反 保护 属性 规定 。 所 以 ,A=1 表示 已 访 
问 过 对 应 的 物理 页 。CPU 不 清除 A 位 。 通 过 周期 性 地 检测 及 清除 A 位 ,操作 系统 就 可 确定 
哪些 页 在 最 近 一 段 时 间 未 被 访问 过 。 当 存储 器 资源 紧缺 时 ,这 些 最 近 未 被 访问 的 页 很 可 能 就 
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被 选择 出 来 ,将 它们 从 内 存 换 出 到 磁盘 上 去 。 

PTE 中 位 6 是 写 标志 位 , 记 作 D。 在 写 访问 物理 页 时 ,CPU 会 把 对 应 PTE 中 D 位 置 为 
1。 如 果 操 作 系 统 在 把 某 页 从 磁盘 上 读 入 内 存 时 ,把 页 表 中 对 应 PTE 项 的 D 位 清 0, 那 么 如 果 
以 后 发 现 D=1, 说 明 已 经 写 过 对 应 的 物理 页 。 通 过 检测 D 位 ,操作 系统 可 以 确定 对 应 的 物理 
页 是 否 被 写 过 。 在 当 需 要 把 某 页 从 内 存 换 出 到 磁盘 上 去 ,如 果 该 页 的 D 位 为 1, 那么 必须 实施 
写 磁 盘 动 作 ; 否则 ,不 必 实 施 写 磁盘 动作 ,因为 该 页 没有 被 修改 过 。 


9.5.4 分 页 存储 管理 机 制 的 演示 (示例 四 ) 


下 面 给 出 演示 分 页 存储 管理 机 制 使 用 的 示例 四 。 如 前 所 述 ,在 写 存储 单元 时 ,CPU 会 设 
置 对 应 页 表 项 PTE 中 A 位 和 D 位 。 示 例 四 的 逻辑 功能 是 ,以 十 六 进 制 数 形式 显示 某 个 PTE 
项 在 变化 前 后 的 内 容 。 示 例 四 假设 计算 机 系统 至 少 具有 4MB 的 物理 内 存 。 

1. 演示 内 容 和 执行 步 又 

为 了 简单 化 ,示例 四 没有 安排 局 部 描述 表 LDT 和 中 断 描述 符 表 IDT, 不 允许 中 断 ,也 不 考 
虑 发 生 异常 。 演 示 内 容 包 括 : 分 页 存储 管理 机 制 的 开启 和 关闭 ; 线性 地 址 到 物理 地 址 的 转 
换 ; 页 表 项 PTE 中 属性 的 变化 。 

本 示例 的 执行 步骤 如 下 。 

(1) 在 实 方式 下 为 进入 保护 方式 做 准备 。 类 似 示 例 二 ,在 准备 好 全 局 描述 符 表 GDT 之 
后 ,加 载 全 局 描述 符 表 寄存 器 GDTR 。 

(2) 切换 到 保护 方式 ,进入 临时 代码 段 TempCode。 把 高 端 演 示 代 码 传送 到 预定 的 高 端 
内 存 区 域 (地 址 1MB 以 上 区 域 ) 。 然 后 , 转 入 低 端 演示 代码 段 DemoCode。 为 了 较 好 地 演示 ， 
演示 代码 由 两 部 分 构成 : 一 部 分 位 于 低 端 内 存 区 域 , 负 责 初始 化 页 目录 和 页 表 等 ,执行 时 并 未 
启用 分 页 机 制 ; 男 一 部 分 位 于 高 端 内 存 区 域 ,负责 实现 逻辑 功能 ,执行 时 已 经 启用 分 页 机 制 。 

(3) 为 启用 分 页 存储 管理 机 制 做 准备 。 建 立 页 目录 PDT 和 使 用 到 的 两 张 页 表 PT0 及 
PT1, 如 图 9. 20 所 示 。 然 后 加 载 CR3 ,使 其 指向 页 目录 PDT。 

(4) 启用 分 页 存储 管理 机 制 。 

(5) 转 入 高 端 演 示 代 码 段 ,实现 预定 的 逻辑 功能 ,也 即 显示 指定 PTE 项 的 内 容 。 由 此 演 
示 在 分 页 存储 管理 机 制 启用 后 的 程序 执行 和 数据 存 取 。 然 后 , 跳 转 回 到 低 端 演示 代码 。 

(6) 关闭 分 页 存储 管理 机 制 。 

(7) 跳 转 回 到 临时 代码 段 TempCode, 做 返回 实 方式 的 准备 。 

(8) 返回 到 实 方式 。 

2. 源 程序 

示例 四 的 源 程序 dp94. asm 如 下 : 

;演示 分 页 存储 管理 机 制 的 使 用 ( 示例 四 ,dpp4) 

; ;常量 声明 
存在 属性 位 P 值 
:RMN 属 性 位 值 , 读 快 行 
RMN 属性 值 , 读 /号 执行 
:US 属性 值 ,系统 级 
:US 属性 值 ,用 户 级 


EE 在 让 二 


B RERRE 


200000H ;页 目录 表 所 在 物理 页 的 地 址 
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PTIO_AD Ey 202000H ;页 表 0 所 在 物理 页 的 地 址 
PTLAD Ey 201000H ;页 表 1 所 在 物理 页 的 地 址 
PHVB_AD Ey 0B8000H ;视频 存储 区 的 物理 地 址 
LoB_AD Ey OFOOOH ;视频 存储 区 的 逻辑 地 址 ( 线性 地 址 ) 
MPVB_AD EU 301000H 线性 地 址 (B8000H 所 映射 的 物理 地 址 
PhSO_AD EU 309000H 闹 端 演示 代码 所 在 段 的 起 始 物 理 地 址 
LoSc_ AD EU 40D000H 闹 端 演示 代码 所 在 段 的 起 始 线 性 地 址 
% include " DWC.H" 文件 CH 含有 宏 的 声明 和 符号 常量 等 
section text : 段 text 
bits 16 ;16 位 段 模式 
Head: ;工作 程序 特征 信息 
HEADER end_of _text，Begin 2000H 
GDTSeg: ;全 局 描述 符 表 GOT 
Dumy DESCRIPTOR 00000 
Normal DESCRIPTOR CFFFFH 0.0. ATDW.O 
Nomal_Sel eq Nomal- GDTSeg 
;页 目录 表 所 在 段 描述 符 ( 保护 方式 下 初始 化 时 使 用 ) 
PDTable DESCRIPTOR CFFFH{ PDT_AD & OFFFRI ,{ PDT AD>> 1$ ,ATDW 0 
PDT Sel equ PTable- GDTSeg 
;页 表 0 所 在 段 描述 符 ( 保护 方式 下 初始 化 时 使 用 ) 
PTable0 DESCRIPTOR CFFFH{ PTO_AD & OFFFFH ,{ PTO AD>> 0 ,AIW0 
PTO Sel equ Plabled- GDTSeg 
;页 表 1 所 在 段 描述 符 ( 保护 方式 下 初始 化 时 使 用 ) 
PTable1 DESCRIPTOR CFFFH{ PT1_AD & OFFFF ,{ PT1_AD>> 1$ ,AIWO 
PT1_Sel eq Plablet- GDTSeg 
;逻辑 上 的 视频 存储 区 所 在 段 描 述 符 
LVidecMenm DESCRIPTOR 399{ LoB_ AD & OFFFFH ,{ LOVB_AD>> 协 ,AIDWO 
LWenm Sel eq LVidecMem- GDTSeg 
;逻辑 上 的 高 端 演示 代码 段 描述 符 ( 及 位 代码 段 ) 
LOode DESCRIPTOR LerHAO- 1,{ LoSC_AD & OFFFFH ,{ LoSC AD>> 协 ,ATCE2.0 
LOode_Sel eq LCode- GDTSeg 
存放 高 端 演示 代码 的 数据 段 描述 符 ( 上 传 时 的 目标 段 ) 
HACode DESCRIPTOR LerHAO- 1,{ PHSC_ AD & OFFFFH ,{ PhSC_AD>> 人 ,AIDWO 
HACode Sel eq HCode- GDTSeg 
InitcDT: ;以 下 是 需要 另行 初始 化 的 描述 符 
:临时 代码 段 描述 符 ( 6 位 段 ) 
TerpCode DESCRIPTOR OFFFFH OQ.0 ATOR.O 
TCode_Sel equ TerpOode- GDTSeg 
; 低 端 演示 代码 段 描述 符 ( 也 位 段 ) 
DemoCode DESCRIPTOR (OFFFFH 0.0. ATOE32.0 
DCode_Sel equ DemCode- GDTSeg 
江 作 任务 数据 段 描述 符 
DemoData DESCRIPTOR GOFFFHOOAIW0 


DData_ Sel equ DemData- GDTSeg 
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江 作 任务 堆栈 段 描述 符 ( 2 位 段 ) 


DemoStack DESCRIPTOR CFFFFH 0.0. ATDWS2.0 
DStack_Sel equ DemStack- GDTSeg 
NnDescG eq ($- Initoy /8 ;需要 初始 化 的 描述 符 个 数 
LenGDT eu $-GDTSeg ;GT 表 的 长 度 
align 16 ;16 字 节 对 齐 
bits 32 ; 乌 位 段 模式 
高 端 演 示 代 码 段 ( 了 ?位 段 ) 


;功能 : 在 屏幕 上 显示 提示 信息 
;为 了 充分 演示 ,这 部 分 代码 会 被 上 传 到 高 端的 物理 地 址 ( WB 以 日 区 域 





HABegin: 
EchoEDX: 症 六 进 制 数 形式 显示 EX 的 内 容 
MV EX 8 ;采用 直接 写 屏 方式 显示 
RL EX4 
WW A,DL 
AD AL OH 
AD A,'0' 
OP AL '9' 
JE .2 
AD AL7 
.L2:STOSW 
LO .1 
FET 
HAStart: 
Rel_HAS eq $-HBegin 
WW A PTO Sel /1 
WW FSA ;用 于 页 表 0 所 在 段 
MW EX(LoB MD>12)* 4 
MW EX [FS:EEX] ;取得 对 应 逻辑 视频 存储 区 的 PTEMa 2 
WY AX LWem Sel ; Ma3 
WwW EX ;用 于 视频 存储 区 
MY El, Sr gr 2 ;显示 信息 的 屏幕 位 置 (第 5 行 ) 
MV ESI, Message ;指向 待 显示 字符 串 
WW A 1H ; 蓝 底 白 字 
L1:LODEB 
RR ALA 学 符 串 以 0 结尾 
下 :此 
STOSW ;填写 到 视频 存储 区 ( 显示 ) 
JP SHRT.L1 
AE 
AD Bl,4 ;间隔 两 个 字符 
MV Ah 4 ; 红 底 白字 
CAL ”EchoEDX ;显示 原先 的 PE 值 
WW EX [FS:EBBM ;取得 对 应 逻辑 视频 存储 区 的 PTEMa 4 
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AD El,4 ;间隔 两 个 字符 
MW A SH ;粉底 白字 
CAL EchoEDX ;显示 现在 的 PE 值 
JP DCode Sel:Damo3 ; 跳 转 回 低 端 演示 代码 段 
LerHA eu $-HBegin 高 端 演示 代码 段 的 长 度 
align 16 ;16 字 节 对 齐 
江 作 任务 数据 段 
Message DB 'PTE for LOB:',0 


align 16 ;16 字 节 对 齐 
;工作 任务 堆栈 段 
StackSeg: 
LenStack eq 512 

times LenStack 虽 0 


: 低 端 演示 代码 段 ( 了 2 位 段 ) 


bits 2 ;采用 了 位 段 模式 
DemcBegin: 

MX PDT_Sel ;准备 初始 化 页 目录 表 

EX ;用 于 页 目录 表 所 在 段 

I, mI 

ECX 1024 

EAX EAX 

STOSD ; 先 把 全 部 表 项 置 成 无 效 ( P 0) 


;再 置 PT 表 项 0 和 表 项 1 
WORD [ES:0], PTO_AD|( USU+ RWH PL) 
DWORD [ES:4], PT1_AD|C USU+ RW PL) 


AX, PTO_Sel ;准备 初始 化 页 表 0 

EA ;用 于 页 表 0 所 在 段 

EI, I 

EX, 1024 

EAX EAX ;线性 地 址 00000000H 

EAX USUr RWr PL ;映射 相同 地 址 的 物理 页 
1: 

EAX 1000H 

ju 省 先 全 部 置 成 直接 映射 

了 1( PWB AD>> 12) * 4 ;然后 ,特别 设置 两 个 表 项 


DWRD [ES: 印 ]，MPVB_AD+r USSr RW PL 
BI,( LoB_AD>>12) * 4 
DWRD [ES:DH, PB AD+ US RRr PL ;V@5 


车 豆 豆 页 豆 豆 豆 司 百 国 呈 妆 豆 间 豆 豆 ， 瑟瑟” 本 半 吾 革 吾 本 


以 PTLSel ;准备 初始 化 页 表 1 
EK ;用 于 页 表 1 所 在 段 
I, mI 





新 概念 汇编 语言 

MO EX 1024 

MN ”EAX 400000H ;线性 地 址 00400000H 
L2:STOSD 

AD ”EX 1000H 

LP .2 ;首先 全 部 置 成 无 效 

;然后 ,特别 设置 一 个 表 项 

WW EI((LoSC D>> 12) &3FH) * 4 

MX DWFD [ES:BD， Phsc ADr USU+ RIR+ PL 

WY EM FOTO ;页 目录 表 物理 地 址 

WW m3 EAX ;设置 页 目录 寄存 器 

WD/ EM am 准备 启用 分 页 机 制 

R EM 800000H 

MW C0 EX 启用 分 页 机 制 

JWP SHRT PageE 测 新 指令 顶 取 队列 ， 真正 启用 分 页 
PageE: 沁 启 用 分 页 

MV AX DStack_Sel ;建立 演示 任务 的 堆栈 

WW SSM 

WY Esp, StackSegt LenStack 

WY/ 以 DData Sel 演示 任务 数据 自 

WwW DA 

跳 转 到 高 端 演示 代码 

MP Loode Sel:Rel_HAS ;Ma6 
Demo3: 

MV EAX CR ;准备 关闭 分 页 机 制 

AD ”EAX FFFFFFH ;Ma7 

WwW EX ;关闭 分 页 机 制 

JP ”SHORT PageD ;真正 关闭 分 页 机 制 
PageD: 沁 关 闭 分 页 


;准备 规范 段 选择 子 
;切换 到 临时 代码 段 ( 6 位 段 ) 


DemocodelN eu $ ; 低 端 演示 代码 段 的 长 度 
临时 过 渡 代 码 段 

align 16 ;16 字 节 对 齐 

bits 16 ;采用 1 位 代码 段 模式 
TC_Entry: 为 启用 分 页 机 制 做 准备 

人 

AX, Tode Sel :临时 代码 段 具 有 可 读 属 性 

Ds Mm ;用 于 源 数据 段 

MV AX HACode Sel ;指向 高 端 内 存 区 域 ( WB 以 上 ) 

WwW EX ;用 于 目标 数据 段 /@8 

MV Sl, HBegin ;被 复制 代码 起 点 在 源 段 内 的 偏 移 
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$$ B85 


入” 司 豆 豆 


;假设 复制 到 目标 段 内 起 点 的 偏 移 是 0 
;学 节 数 

;上 传 

; 转 到 低 端 演示 代码 
;准备 切换 到 实 方式 


;加 载 规范 描述 符 选择 子 


;切换 回 实 方式 
; 清 指令 预 取 队 列 , 真 正 进入 实 方式 
;将 到 达 实 方式 的 Real 处 ( 需 重 定位 ) 


从 CS 

DM 
[ToReal+ 3], MX 
[Varss], SS 
[VarESP], ESP 


SI，InitGDT 
CX NnDescG 
InitDescBA 
SI, WDIR 
以 GDTSeg 
InitPeDesc 


[LVGDTRI 


;6 字 节 对 齐 
;采用 16 位 代码 段 模式 
; 伪 描述 符 
;用 于 保存 即 的 变量 
;用 于 保存 SS 的 变量 


重 定位 
;保存 实 方式 下 的 堆栈 


;指向 需要 初始 化 的 首 个 描述 符 
沁 要 初始 化 的 描述 符 个 数 
;初始 化 GT 表 中 的 部 分 描述 符 
;指向 伪 描述 符 

;指向 GT 表 

;初始 化 伪 描 述 符 

;装载 QTR 


和 打开 地 址 线 A20 
;准备 切换 到 保护 方式 


; 清 指 令 预 取 队 列 ,真正 进入 保护 方式 


;现在 又 回 到 实 方式 


和 恢复 堆栈 





CAL Disableh20 ;关闭 地 址 线 A2 

SIl ; 开 中 断 

REF ;返回 到 加 载 器 

% include ”proc asm" ;包含 相关 子 程序 
end_of_text: 源 代码 到 此 为 止 


从 上 述 源 程序 可 知 , 利 用 汇编 器 NASM 的 指示 “%include”, 分 别 包含 了 头 文件 DMC. H 
和 子 程序 文件 PROC. ASM ,相关 说 明 参 见 9.4 节 。 

3. 关于 执行 步 又 的 注释 

下 面 结合 源 程序 对 执行 步骤 进行 说 明 ,与 先前 示例 相同 的 部 分 ,就 不 袭 述 。 

(1) 部 分 演示 代码 的 移动 。 为 了 充分 说 明 分 页 存储 管理 机 制 , 部 分 演示 代码 在 高 端 内 存 
区 域 执行 。 在 初始 化 时 ,把 这 部 分 演示 代码 上 传 到 预定 的 高 端 内 存 区 域 。 预 定 的 内 存 区 域 从 
00303000H 开始 ,也 即 是 页 码 为 00303H 的 物理 页 。 由 高 端 演 示 代 码 实现 本 示例 的 逻辑 功能 。 
由 于 涉及 到 地 址 在 1MB 以 上 存储 区 域 的 操作 ,因此 需要 在 保护 方式 下 进行 ,注意 初始 化 时 还 
没有 启用 分 页 机 制 。 

(2) 页 映射 表 的 初始 化 。 本 示例 按 图 9. 20 所 示 安 排 页 映射 表 。 页 目录 安排 在 页 码 为 
00200H 的 物理 页 中 ,页 表 0 安排 在 页 码 为 00202H 的 物理 页 中 ,页 表 1 安排 在 页 码 为 00201H 
的 物理 页 中 。 为 了 充分 演示 ,故意 这 样 安排 两 张 页 表 。 示 例 程序 涉及 的 线性 地 址 空间 不 超出 
007FFFFFH(8MB) ,所 以 只 使 用 两 张 页 表 ,为 此 页 目录 中 的 其 他 项 被 置 为 无 效 (P=0) 。 

页 表 0 把 线性 地 址 空间 中 的 00000000H 一 003FFFFFH( 第 一 个 4MB) 映 射 到 物理 地 址 空 
间 中 。 本 示例 在 初始 化 页 表 0 时 ,使 该 线性 地 址 空间 直接 映射 到 相同 地 址 的 物理 地 址 空间 , 除 
了 线性 地 址 空间 中 页 码 为 000B8H 和 000F0H 这 两 页 之 外 。 为 了 充分 演示 ,故意 把 000B8H 
页 映射 到 页 码 为 00301H 的 物理 页 ,把 000F0H 页 映射 到 页 码 为 000B8H 的 物理 页 。 如 
图 9. 21 下 半 部 分 所 示 ,根据 假设 至 少 存在 4MB 物理 内 存 。 

页 表 1 把 线性 地 址 空间 中 的 00400000H 一 007FFFFFH( 第 二 个 4MB) 映 射 到 物理 地 址 空 
间 中 。 本 示例 在 初始 化 页 表 1 时 ,似乎 使 该 线性 地 址 空间 直接 映射 到 相同 地 址 的 物理 地 址 空 
间 , 但 是 除了 对 应 线性 地 址 空间 中 00402H 页 的 表 项 被 另外 设置 外 ,其 他 表 项 中 的 P 位 为 0， 
也 即 表示 对 应 物理 页 不 存在 。 初 始 化 后 ,页 表 1 的 第 2 项 把 线性 地 址 空间 中 的 00402H 页 , 映 
射 到 页 码 为 00303H 的 物理 页 ,也 就 是 存放 高 端 演示 代码 的 指定 内 存 区域 。 如 图 9. 21 的 上 半 
部 分 所 示 ,阴影 部 分 的 线性 空间 页 没有 映射 到 物理 页 。 

本 示例 采用 直接 写 屏 方式 实现 显示 ,在 逻辑 上 写 到 000F0000H 开始 的 线性 地 址 空间 区 
域 ,但 由 于 页 映射 ,最 终 写 到 000B8000H 开始 的 真正 视频 存储 区 。 请 参见 视频 存储 区 段 描 述 
符 LVideoMem 的 定义 ,以 及 源 程序 “//@3” 行 。 

类 似 地 ,逻辑 上 高 端 演示 代码 位 于 00402000H 起 始 的 线性 地 址 空间 区 域 ,但 由 于 页 映射 
实际 占用 的 00303000H 起 始 的 物理 地 址 空间 区 域 。 在 启用 分 页 机 制 之 前 ,上 传 演示 代码 时 ， 
就 是 传送 到 上 述 指 定 内 存 区 域 ,参见 描述 符 HACode 的 定义 ,以 及 源 程 序 “//@8” 行 。 在 启用 
分 页 机 制 之 后 , 跳 转 到 高 端 演示 代码 执行 时 ,使 用 的 是 高 端 线性 地 址 ,参见 源 程 序 “//@6” 行 和 
描述 符 LCode。 

(3) 分 页 存储 管理 机 制 的 启用 。 在 建立 好 页 映射 表 后 ,启用 分 页 存储 管理 机 制 所 要 做 的 
操作 比较 简单 ,只 要 把 控制 寄存 器 CR0 中 的 最 高 位 ,也 就 是 PG 位 置 1。 具 体 指令 如 下 : 
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007FFFFFH 
00402000H 
00400000H 003FFFFFH 
te 
00303000H 高 端 演示 代码 | 00303000H 
00301000H 00301000H 
页 表 0 
00202000H 人 00202000H 
00201000H 页 00201000H 
00200000H 一 00200000H 
en re 
信 区 
000B8000H 视频 不全 区 000B8000H 
| 
示例 程序 代码 自身 上 ~ 示例 程序 代码 自 届 
1 示例 程序 代码 自身 示例 程序 代码 自身 v000 
| 
00000000H 00000000H 
线性 地 址 物理 地 址 


图 9.21 示例 四 的 线性 地 址 空间 到 物理 地 址 空间 的 映射 示意 图 


WwW EX CR ;准备 启用 分 页 机 制 

RR EMX 8000000H 

MXM Om EX ;启用 分 页 机 制 

JWP SHRT PageE 击 新 指令 预 取 队 列 , 真 正 启用 分 页 
PageE: 沁 启 用 分 页 机 制 


在 启用 分 页 存储 管理 机 制 前 ,线性 地 址 就 是 物理 地 址 ; 在 启用 分 页 存储 管理 机 制 后 ,线性 
地 址 要 通过 分 页 机 制 的 转换 , 才 成 为 物理 地 址 。 尽 管 使 用 一 条 转移 指令 ,可 清除 预 取 的 指令 ， 
但 随后 在 取 指 令 时 使 用 的 线性 地 址 就 要 经 过 转换 才 成 为 物理 地 址 。 为 了 保证 顺利 过 渡 , 在 启 
用 分 页 机 制 之 后 的 过 渡 阶 段 , 仍 要 维持 线性 地 址 等 同 于 物理 地 址 。 为 了 做 到 这 一 点 ,在 建立 页 
映射 表 时 ,必须 使 得 实现 过 渡 的 代码 所 在 的 线性 地 址 空间 页 映射 到 具有 相同 地 址 的 物理 地 址 
空间 页 。 本 示例 中 页 表 0 就 做 到 了 这 一 点 ,参见 图 9. 21。 

(4) 分 页 存储 管理 机 制 的 关闭 。 只 要 把 控制 寄存 器 CR0 中 的 PG 位 清 0, 便 关闭 分 页 存 
储 管理 机 制 。 参 见 源 程序 “//@7” 行 。 在 这 一 过 渡 阶 段 , 也 要 保持 地 址 转换 前 后 的 一 致 。 

(5) 逻辑 功能 的 实现 。 本 示例 的 逻辑 功能 是 ,以 十 六 进 制 数 的 形式 显示 某 个 页 表 项 PTE 
的 内 容 。 为 了 反映 PTE 的 变化 ,刻意 选择 了 逻辑 上 的 视频 存储 区 对 应 的 PTE 项 。 逻 辑 上 的 
视频 存储 区 起 始 地 址 是 000F0000H, 对 应 页 表 0 中 第 0FO0H 项 。 在 初始 化 时 ,其 物理 页 码 是 
000B8H ,其 属性 值 是 005H( 表 示 是 存在 的 、 只 读 、 用 户 级 的 页 ) ,参见 源 程序 “//@5” 行 。 直 接 
填写 视频 存储 区 显示 提示 信息 ,意味 着 写 访问 ,CPU 会 将 该 PTE 项 中 A 位 和 D 位 置 1。 于 
是 ,其 属性 值 变化 为 065H。 

在 显示 提示 信息 之 前 后 ,分 别 获取 对 应 PTE 项 的 内 容 , 参 见 源 程序 “//@1” 行 “//@2” 行 
和 “//@4” 行 。 由 于 启用 了 分 页 机 制 ,这 些 访问 页 表 0 的 操作 同样 要 进行 地 址 转换 ,但 按 设置 
的 页 映射 关系 ,线性 地 址 就 等 于 物理 地 址 。 两 次 调用 子 程序 EchoEDX, 以 十 六 进 制 数 的 形式 
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显示 该 PTE 项 变化 前 后 的 内 容 。 由 于 安排 了 堆栈 ,因此 可 以 进行 调用 子 程序 等 涉及 堆栈 的 
操作 。 

(6) 页 级 保护 的 演示 。 在 进入 保护 方式 之 后 ,特权 级 一 直 是 0 级 。 所 以 ,无 论 系统 级 和 用 
户 级 页 ,无论 只 能 读 /执行 ,还 是 读 / 执 行 / 写 ,总 是 可 进行 各 种 形式 的 访问 。 虽 然 视频 存储 区 对 
应 的 PTE 中 属性 是 只 读 ,但 仍然 可 以 向 其 写 ,因为 当前 特权 级 是 最 高 级 0。 


9.6 任务 状态 段 和 控制 门 


每 个 任务 有 一 个 任务 状态 段 TSS, 用 于 保存 任务 的 有 关 信 息 , 在 发 生 任 务 之 间 的 切换 或 
者 任务 内 特权 级 的 变换 时 ,要 使 用 这 些 信息 。 为 了 控制 任务 的 切换 ,以 及 控制 任务 内 特权 级 的 
变换 ,一 般 要 通过 控制 门 实施 转移 。 本 节 介 绍 任务 状态 段 和 控制 门 。 


9.6.1 系统 段 描 述 符 


1. 系统 段 描 述 符 

除了 一 般 的 存储 段 外 ,还 有 特殊 的 系统 段 。 先 前 介绍 的 局 部 描述 符 表 段 (LDT 段 ) 和 稍 后 
介绍 的 任务 状态 段 (TSS 段 ) 都 属于 系统 段 。 为 了 区 别 于 存储 段 描述 符 , 把 用 于 描述 系统 段 的 
描述 符 称 为 系统 段 描述 符 。 

系统 段 描述 符 的 一 般 格式 如 图 9. 22 所 示 。 与 图 9. 5 所 示 的 存储 段 描述 符 相 比 , 它 们 很 相 
似 , 关 键 区 分 是 属性 域 的 描述 符 类 型 位 S 之 值 。S=1 表示 存储 段 描 述 符 ; S=0 表示 系统 段 描 
述 符 。 系 统 段 描述 符 中 的 段 基 地 址 和 段 界限 字段 与 存储 段 描 述 符 中 意义 完全 相同 ; 属性 域 的 
P 位 和 DPL 字段 .G 位 ,AVL 位 的 意义 及 作用 也 完全 相同 。 存 储 段 描述 符 属 性 域 的 D 位 在 系 
统 段 描述 符 中 不 使 用 , 现 用 符号 X 表示 。 
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L 19 … 16 0 
































图 9.22 系统 段 描述 符 的 一 般 格式 


系统 段 描述 符 的 类 型 字段 TYPE 仍 是 4 位 ,其 编码 及 表示 的 类 型 如 表 9. 5 所 示 , 其 含义 
与 存储 段 描述 符 的 类 型 完全 不 同 。 从 表 9. 5 可 知 ,只 有 类 型 编码 为 2.1、3、9 和 B 的 描述 符 才 
是 真正 的 系统 段 描述 符 , 它 们 用 于 描述 局 部 描述 符 表 段 LDT 和 任务 状态 段 TSS, 其 他 类 型 的 
描述 符 则 是 门 描述 符 。 
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表 9.5 系统 段 和 门 描述 符 类 型 字段 的 编码 及 含义 






































类 型 编码 说 明 类 型 编码 说 明 
0 保留 8 保留 
1 可 用 16 位 TSS 9 可 用 32 位 TSS 
2 LDT A 保留 
3 忙 的 16 位 TSS B 忙 的 32 位 TSS 
4 16 位 调用 门 C 32 位 调用 门 
5 任务 门 D 保留 
6 16 位 中 断 门 E 32 位 中 断 门 
7 16 位 陷阱 门 F 32 位 陷阱 门 


在 9.2.2 节 中 介绍 了 汇编 器 NASM 支持 的 存储 段 描述 符 宏 DESCRIPTOR ,利用 它 仍然 
能 够 方便 地 在 源 程 序 中 定义 系统 段 描 述 符 。 
另外 ,在 头 文 件 DMC. H 中 ,已 经 包括 如 下 符号 常量 。 


ATILDT EU 如 ;局 部 描述 符 表 段 类 型 值 
ATTASKGAT Ey a ;任务 门类 型 值 
ATTSS22 EU 是 ;32TSS 类 型 值 
ATOGAT322 Ey aH ;了 2 调用 门类 型 值 
ATIGAT32 EU 。 引 ;中 断 门类 型 值 
ATTGAT22 EU 8 ;2 陷阱 门类 型 值 

2. LDT 段 描述 符 


LDT 段 描述 符 描述 任务 的 局 部 描述 符 表 LDT 段 。 在 示例 三 中 使 用 了 局 部 描述 符 
表 LDT。 

【 例 9-21】 如 下 描述 符 LDTable 描述 一 个 LDT 段 , 段 基地 址 是 654320H, 段 界限 是 
2FH, 可 以 含有 6 个 描述 符 。 

LDTable DESCRIPIR FH 4320H eH gH 0 

按 图 9. 22 所 示 和 表 9. 5 所 列 , 属 性 字段 82H ,表示 这 是 一 个 描述 LDT 段 的 系统 描述 符 ， 
而 且 描 述 符 特权 级 DPL 是 0。 

LDT 段 描述 符 只 能 出 现在 全 局 描述 符 表 中 才 有 效 。 在 装载 LDTR 寄存 器 时 ,描述 符 中 
的 LDT 段 基 地 址 和 段 界限 等 信息 被 装 入 LDTR 高 速 缓冲 存储 器 中 ,参见 图 9. 11 。 

3. 任务 状态 段 描 述 符 

任务 状态 段 TSS 用 于 保存 任务 的 各 种 状态 信息 。 稍 后 将 详细 介绍 任务 状态 段 (Task 
State Segment) 的 结构 和 作用 。TSS 描述 符 用 于 描述 一 个 任务 状态 段 。 考 虑 到 兼容 的 原因 ， 
TSS 描述 符 分 为 16 位 和 32 位 两 种 。TSS 描述 符 规定 了 任务 状态 段 的 基地 址 和 任务 状态 段 
的 大 小 。 

【 例 9-22〗 如 下 描述 符 DemoTSS 描述 一 个 可 用 的 32 位 任务 状态 段 , 段 基地 址 是 
456780H ,以 字 节 为 单位 的 界限 是 104 ,描述 符 特权 级 DPL 是 0。 

DemoTSS DESCRIPTR 104 680H 4 SH 0 

在 装载 任务 寄存 器 TR 时 ,描述 符 中 的 TSS 段 基地 址 和 段 界限 等 信息 被 装 和 如 图 9. 9 所 
示 的 TR 高 速 缓冲 存储 器 中 。 在 任务 切换 或 执行 LTR 指令 时 ,将 装载 TR 寄存 器 。 

TSS 描述 符 中 的 类 型 规定 TSS 要 么 为 “ 忙 ”, 要 么 为 “可 用 ”。 如 果 一 个 任务 是 当前 正在 执 
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行 的 任务 ,或 者 是 用 TSS 中 的 链接 字段 沿 挂 起 任务 链接 到 当前 任务 上 的 任务 ,那么 该 任务 是 
“ 忙 ”的 任务 ; 否则 该 任务 为 “可 用 ”任务 。 
利用 段 间 转移 指令 JMP 和 段 间 调 用 指令 CALL ,直接 通过 TSS 描述 符 可 实现 任务 切换 。 


9.6.2 门 描述 符 


除 存储 段 描述 符 和 系统 段 描述 符 外 ,还 有 一 类 门 描述 符 。 门 描述 符 并 不 描述 某 种 内 存 段 ， 
而 是 描述 控制 转移 的 和 人口 点 。 这 种 描述 符 好 比 一 个 通 向 另 一 代码 段 的 门 。 通 过 这 种 门 ,可 实 
现任 务 内 特权 级 的 变换 或 者 任务 间 的 切换 。 所 以 ,这 种 门 描述 符 也 称 为 控制 门 。 

1. 门 描述 符 

门 描述 符 的 一 般 格式 如 图 9. 23 所 示 。 门 描述 符 只 有 位 于 描述 符 内 偏 移 5 的 类 型 字 节 与 
系统 段 描 述 符 保持 一 致 ,也 由 该 字 节 标识 门 描述 符 和 系统 段 描 述 符 。 该 字 节 内 的 P 位 和 DPL 
字段 的 意义 与 其 他 描述 符 中 的 意义 相同 。 其 他 字 节 主要 用 于 存放 一 个 48 位 的 全 指针 (16 位 
的 段 选择 子 和 32 位 的 偏 移 )。 
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图 9.23 门 描述 符 的 一 般 格式 


按 图 9.23 给 出 的 门 描述 符 的 格式 ,基于 汇编 器 NASM, 可 采用 如 下 形式 声明 一 个 宏 ,以 
表示 门 描述 符 结构 。 


% macro GE 5 

.OFFSETL DN  %1 ; 伺 位 偏 移 的 低 6 位 
.SECTOR DW %2 : 段 选择 子 

.DOOUNT DB %3 ; 双 字 计数 字段 
.GTYPE DB %4 ;类 型 ( 属性 ) 
.OFFSETH DN %5 ;2 位 偏 移 的 高 6 位 
% endmacro 


利用 上 面 的 宏 GATE ,在 汇编 语言 源 程序 中 可 以 方便 地 定义 门 描述 符 。 在 本 章 示例 所 使 
用 的 头 文件 DMC. H 中 ,应 该 含有 上 述 宏 GATE 的 声明 。 

【 例 9-23】〗 如 下 门 描述 符 SubGate 描述 一 个 32 位 调用 门 , 门 内 的 段 选择 子 是 20H, 和 人口 
偏 移 是 123456H , 门 描述 符 特权 级 是 3, 双 字 计 数 是 0。 

SubGate GANIE 3454 ZH 0 80H EH OH 

从 表 9.5 可 知 , 门 描述 符 又 可 分 为 任务 门 、 调 用 门 、 中 断 门 和 陷阱 门 ,并 且 除 任务 门 之 外 ， 
其 他 门 描述 符 还 各 分 成 16 位 和 32 位 两 种 。 

2. 调用 门 

调用 门 描述 某 个 子 程序 的 入 口 。 调 用 门 内 的 段 选 择 子 必须 指向 某 个 代码 段 描述 符 ,调用 
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门 内 的 偏 移 是 对 应 代码 段 内 的 偏 移 。 利 用 段 间 调用 指令 CALL, 通 过 调用 门 可 实现 任务 内 从 
外 层 特权 级 变换 到 内 层 特权 级 。 

如 图 9. 23 所 示 , 门 描述 符 内 偏 移 4 字 节 的 位 0 至 位 4 是 双 字 计数 字段 Count, 该 字段 只 
在 调用 门 描述 符 中 有 效 ,在 其 他 门 描 述 符 中 无 效 。 主 程序 通常 通过 堆栈 把 入 口 参数 传递 给 子 
程序 ,如 果 在 利用 调用 门 调用 子 程序 时 引起 特权 级 的 变换 和 堆栈 的 变换 ,那么 就 需要 将 外 层 堆 
栈 中 的 参数 复制 到 内 层 堆栈 。 该 双 字 计数 字段 就 是 用 于 说 明 这 种 情况 发 生 时 ,要 复制 的 双 字 
参数 的 数量 。 

3. 任务 门 

任务 门 指示 任务 。 任 务 门 内 的 段 选择 子 必 须 指 向 GDT 表 中 的 任务 状态 段 TSS 描述 符 ， 
门 中 的 偏 移 无 意义 。 任 务 的 代码 人 口 点 (恢复 点 ) 保 存在 TSS 中 。 利 用 段 间 转 移 指令 JMP 和 
段 间 调用 指令 CALL ,通过 任务 门 可 实现 任务 切换 。 

4. 中 断 门 和 陷阱 门 

中 断 门 和 陷阱 门 描 述 中 断 或 异常 处 理 程序 的 入 口 点 。 中 断 门 和 陷阱 门 内 的 段 选择 子 必须 
指向 某 个 代码 段 描述 符 , 门 内 的 偏 移 就 是 对 应 代码 段 的 入口 点 偏 移 。 中 断 门 和 陷阱 门 只 有 在 
中 断 描述 符 表 IDT 中 才 有 效 。 关 于 中 断 门 和 陷阱 门 的 区 别 在 9. 8 节 中 介绍 。 


9.6.3 任务 状态 段 


任务 状态 段 (Task State Segment) 是 保存 一 个 任务 重要 信息 的 特殊 段 。TSS 描述 符 用 于 
描述 这 样 的 系统 段 。 如 图 9. 9 所 示 ,任务 寄存 器 TR 的 可 见 部 分 含有 当前 任务 的 TSS 描述 符 
的 段 选 择 子 ,TR 的 隐藏 部 分 含有 当前 任务 TSS 的 段 基 地 址 和 段 界 限 等 信息 。 

任务 状态 段 TSS 在 任务 切换 过 程 中 起 着 重要 作用 ,通过 它 实 现任 务 的 挂 起 和 恢复 。 任 务 
切换 是 指 挂 起 当前 正在 执行 的 任务 ,恢复 男 一 个 任务 的 执行 。 在 任务 切换 过 程 中 ,首先 ,CPU 
中 各 寄存 器 的 当前 值 被 自动 地 保存 到 TR 所 指定 的 TSS 中 ; 然后 ,对 应 下 一 任务 TSS 的 段 选 
择 子 被 装 和 人 TR; 最 后 ,从 TR 所 指定 的 TSS 中 取出 各 寄存 器 的 值 送 到 CPU 的 各 寄存 器 中 。 
由 此 可 知 ,通过 在 任务 状态 段 TSS 中 保存 任务 现场 各 寄存 器 状态 的 完整 映像 ,实现 任务 之 间 
的 切换 。 

32 位 任务 状态 段 TSS 的 基本 格式 如 图 9. 24 所 示 , 其 中 阴影 部 分 是 保留 的 ,应 该 设置 成 
0。 从 图 中 可 知 ,32 位 TSS 基本 格式 有 104 字 节 组 成 。 这 104 字 节 的 基本 格式 是 不 可 改变 的 ， 
但 在 此 之 外 系统 软件 还 可 定义 若干 附加 信息 。 基 本 的 104 字 节 可 分 为 链接 字段 区 域内 存 堆 
栈 指针 区 域 . 地 址 映射 寄存 器 区 域 、. 寄 存 器 保存 区 域 和 其 他 字段 等 5 个 区 域 。 其 中 ,寄存 器 保 
存 区 域 和 链接 字段 区 域 是 动态 区 域 ,在 任务 切换 时 CPU 会 更 新 动态 区 域 ; 其 他 3 个 区 域 则 是 
静态 区 域 , 在 创建 TSS 时 设置 它们 ,一般 不 会 改变 ,在 任务 切换 时 CPU 只 是 从 中 取得 相应 的 
内 容 。 

1. 寄存 器 保存 区 域 

寄存 器 保存 区 域 位 于 TSS 内 偏 移 20H~5FH 处 ,用 于 保存 通用 寄存 器 、 段 寄存 器 、 指 令 指针 
寄存 器 和 标志 寄存 器 。 当 TSS 对 应 的 任务 正在 执行 时 .保存 区 域 是 未 定义 的 ; 在 当前 任务 被 切 
换 出 去 时 ,这 些 寄存 器 的 当前 值 就 保存 在 该 区 域 。 当 下 次 切换 回 到 原 任 务 时 ,再 从 保存 区 域 恢复 
出 这 些 寄存 器 的 值 ,从 而 使 CPU 恢复 成 该 任务 换 出 前 的 状态 ,最终 使 任务 能 够 恢复 执行 。 

从 图 9. 24 可 知 , 各 通用 寄存 器 对 应 一 个 32 位 的 双 字 ,指令 指针 寄存 器 和 标志 寄存 器 各 对 
应 一 个 32 位 的 双 字 ; 各 段 寄 存 器 也 对 应 一 个 32 位 的 双 字 , 段 寄 存 器 中 的 段 选择 子 只 有 16 





位 ,安排 在 双 字 的 低 16 位 ,高 16 位 空 着 未 用 。 
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SS2 18H 
ESP2 14H 
SSI 10H 
ESP1 0CH 
SS0 8 
ESPO 4 
链接 字段 0 














图 9.24 任务 状态 段 TSS 的 基本 格式 


2. 内 层 堆栈 指针 区 域 

为 了 有 效 地 实现 保护 ,一 个 任务 在 不 同 的 特权 级 下 使 用 不 同 的 堆栈 。 例 如 , 当 从 外 层 特 权 
级 3 变换 到 内 层 特 权 级 0 时 ,任务 使 用 的 堆栈 也 同时 从 3 级 堆栈 变换 到 0 级 堆栈 ; 当 从 内 层 
特权 级 0 变换 到 外 层 特 权 级 3 时 ,任务 使 用 的 堆栈 也 同时 从 0 级 堆栈 变换 到 3 级 堆栈 。 所 以 ， 
一 个 任务 可 能 具有 4 个 堆栈 ,对 应 4 个 特权 级 。4 个 堆栈 需要 4 组 堆栈 指针 。 

TSS 的 内 层 堆栈 指针 区 域 中 有 3 组 堆栈 指针 ,它们 都 是 48 位 的 全 指针 (16 位 的 段 选择 子 
和 32 位 的 偏 移 ) ,分 别 指向 0 级 .1 级 和 2 级 堆栈 的 栈 顶 ,依次 存放 在 TSS 中 偏 移 为 4.0CH 及 
14H 开始 的 位 置 。 当 发 生 向 内 层 转移 时 , 则 把 适当 的 堆栈 指针 装 和 人 到 SS 及 ESP 寄存 器 以 变 
换 到 内 层 的 堆栈 ,外 层 堆栈 的 指针 保存 在 内 层 堆 栈 中 。 没 有 指向 3 级 堆栈 的 指针 ,因为 3 级 是 
在 最 外 层 , 所 以 任何 一 个 向 内 层 的 转移 都 不 可 能 转移 到 3 级。 

但 是 , 当 特 权 级 由 内 层 向 外 层 变 换 时 ,并 不 把 内 层 堆栈 的 指针 保存 到 TSS 的 内 层 堆 栈 指 
针 区 域 。 这 表明 向 内 层 转移 时 ,总 是 认为 内 层 堆 栈 是 一 个 空 栈 。 因 此 ,不 允许 发 生 同 级 内 层 转 
移 的 递归 ,一旦 发 生 向 某 级 内 层 转 移 ,那么 返回 到 外 层 的 正常 途径 是 相 匹 配 的 向 外 层 返回 。 

3. 地 址 映射 寄存 器 区 域 

由 逻辑 地 址 空间 到 线性 地 址 空间 的 映射 由 GDT 表 和 LDT 表 确 定 , 与 特定 任务 相关 的 部 
分 由 LDT 表 确 定 , 而 LDT 表 又 由 寄存 器 LDTR 确定 。 如 果 启 用 分 页 存储 管理 机 制 ,那么 由 
线性 地 址 空间 到 物理 地 址 空间 的 映射 由 包含 页 目录 起 始 物理 地 址 的 控制 寄存 器 CR3 确定 。 
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所 以 ,与 特定 任务 相关 的 逻辑 地 址 空间 到 物理 地 址 空间 的 映射 由 LDTR 和 CR3 确定 。 显 然 ， 
随 着 任务 的 切换 ,地 址 映射 关系 也 要 切换 。 

TSS 的 地 址 映射 寄存 器 区 域 由 位 于 偏 移 1CH 处 的 双 字 字段 (CR3) 和 位 于 偏 移 60H 处 的 
字 字 段 (LDT) 组 成 。 在 任务 切换 时 ,CPU 自动 从 轮 到 执行 的 任务 的 TSS 中 取出 这 两 个 字段 ， 
分 别 装 入 到 寄存 器 CR3 和 寄存 器 LDTR。 这 样 就 切换 了 逻辑 地 址 空间 到 物理 地 址 空间 的 
映射 。 

但 是 ,在 任务 切换 时 ,处 理 器 并 不 把 换 出 任务 当时 的 寄存 器 CR3 和 LDTR 的 内 容 保存 到 
TSS 中 的 地 址 映射 寄存 器 区 域 。 因 此 ,如 果 任 务 改 变 了 CR3 或 LDTR ,那么 必须 把 新 值 保 存 
到 TSS 中 的 地 址 映射 寄存 器 区 域 相 应 字段 中 。 

4. 链接 字段 

链接 字段 安排 在 TSS 内 偏 移 0 开始 的 双 字 中 ,其 高 16 位 未 用 。 在 起 链接 作用 时 , 低 16 
位 保存 前 一 任务 的 TSS 描述 符 的 段 选择 子 。 

如 果 当 前 的 任务 由 段 间 调用 指令 CALL 或 者 中 断 /异常 而 激活 ,那么 链接 字段 保存 被 挂 
起 任务 的 TSS 的 段 选 择 子 , 并 且 标 志 寄 存 器 EFLAGS 中 的 NT 位 被 置 1, 使 链接 字段 有 效 。 
在 返回 时 ,由 于 NT 位 为 1, 中 断 返 回 指令 IRET 将 使 得 控制 沿 着 链接 字段 所 指 恢复 到 链 上 的 
前 一 个 任务 。 

5. 其 他 字段 

为 了 实现 输入 /输出 保护 ,要 使 用 1/O 许可 位 图 。 任务 使 用 的 1/O 许可 位 图 也 存放 在 
TSS 中 ,作为 TSS 的 扩展 部 分 。 在 TSS 内 偏 移 66H 处 的 字 给 出 1/O 许可 位 图 在 TSS 内 的 开 
始 偏 移 。 

在 TSS 内 偏 移 64H 处 的 字 是 为 任务 提供 的 特别 属性 。 目 前 只 定义 了 一 种 属性 , 即 调试 
陷阱 。 该 属性 是 字 的 最 低位 ,用 工 表 示 。 该 字 的 其 他 位 被 保留 ,必须 被 置 为 0。 在 发 生 任务 切 
换 时 ,如 果 进 入 任务 的 荆 位 为 1, 那 么 在 任务 切换 完成 之 后 ,新 任务 的 第 一 条 指令 执行 之 前 产 
生 调 试 陷阱 。 

6. 表示 TSS 结构 的 宏 

根据 图 9. 24 给 出 的 任务 状态 段 TSS 的 格式 ,基于 汇编 器 NASM, 可 采用 如 下 形式 声明 一 
个 宏 ,以 表示 TSS 的 基本 结构 。 


% macro TASKSS 0 ;不 带 参数 
RK Dm 00 ;链接 字 
.TEP DmD 0 10 级 堆栈 指针 
.TRSS0 om 00 

.TRESP1 DD 0 ;1 级 堆栈 指针 
.TRSS1 DO 00 

.TRESP2 DD 0 ;2 级 堆栈 指针 
.TRSS2 Do 00 

.TRR3 DD 0 :CR3 

.TREIP DD 0 ;EIP 

.TREERAG mD 0 ;ELAGS 

.TREA DD 0 :EAX 

.TREX DD 0 :EX 

.TREDX DD 0 :EX 

.TREBX DD 0 ER 





.TRESP DD 0 :EP 
.TREEP DD 0 :EP 

.TRESI DD 0 :EI 

.TFI DD 0 DI 

.TRES DO 00 ;区 

.TRCS bl 00 :CS 

.TRSS bl 00 ;SS 

.TRDS | 00 De 

.TRFS bl 00 :FS 

.TRGS bl 00 :G8 

.TRDT bl 00 :DT 

RU Dm 0 :TSS 的 特别 属性 字 

TRIWP mW $+2 .TIMK ;指向 I 许可 位 图 区 的 指针 
% endmacro 


为 了 便于 在 源 程 序 中 使 用 ,上 述 宏 TASKSS 并 没有 参数 。 在 本 章 示例 所 使 用 的 头 文件 
DMC. H 中 ,也 含有 上 述 宏 TASKSS 的 声明 。 


9.7 控制 转移 


控制 转移 可 分 为 两 大 类 : 同一 任务 内 的 控制 转移 和 任务 间 的 控制 转移 (任务 切换 )。 同 一 
任务 内 的 控制 转移 又 分 为 段 内 转移 、 特 权 级 相同 的 段 间 转移 和 特权 级 变换 的 段 间 转移 。 只 有 
段 间 转 移 才 可 能 涉及 特权 级 变换 和 任务 切换 。 本 节 介 绍 保护 方式 下 的 控制 转移 ,重点 是 任务 
内 的 特权 级 变换 和 任务 间 的 切换 。 


9.7.1 任务 内 相同 特权 级 的 转移 


各 种 段 内 转移 与 实 方式 下 相似 ,由 于 不 改变 代码 段 寄存 器 CS, 因 此 不 涉及 特权 级 变换 和 
任务 切换 。 只 有 各 种 形式 的 段 间 转移 才 可 能 导致 特权 级 变换 或 者 任务 切换 。 

1. 段 间 转移 指令 

指令 JMP、CALL 和 RETF 都 具有 段 间 转 移 的 功能 ,指令 INT 和 IRETD 总 是 段 间 转移 。 
有 时 把 这 些 具有 上段 间 转移 功能 的 指令 统称 为 段 间 转移 指令 。 

在 保护 方式 下 , 段 间 转移 的 目标 地 址 由 段 选 择 子 和 偏 移 两 部 分 构成 , 常 把 它 称 为 目标 指 
针 。 在 32 位 代码 段 中 ,上 述 指针 内 的 偏 移 使 用 32 位 表示 ,这 样 的 指针 被 称 为 48 位 全 指针 。 
例如 ,在 9.4 节 示 例 三 的 32 位 演示 代码 段 内 , 段 间 转移 指令 JMP 和 CALL 都 使 用 了 48 位 全 
指针 。 在 16 位 代码 段 中 ,上 述 指 针 内 的 偏 移 只 使 用 16 位 表示 。 例 如 ,在 上 述 示例 三 的 16 位 
临时 代码 段 内 , 段 间 转 移 指 令 JMP 使 用 的 目标 地 址 并 非 48 位 全 指针 。 

与 实 方式 下 一 样 , 按 给 出 目标 地 址 的 方式 ,指令 JMP 和 CALL 还 可 分 为 直接 转移 和 间接 
转移 两 类 。 如 果 指 令 中 直接 含有 目标 地 址 , 那 就 是 直接 转移 ; 否则 ,就 是 间接 转移 。 普 通 间接 
转移 形式 是 指 指令 给 定 含 有 目标 地 址 的 存储 单元 。 例 如 ,在 上 述 示例 三 的 临时 代码 段 内 ,准备 
切换 回 到 实 方式 的 段 间 转移 指令 就 是 间接 转移 。 

在 保护 方式 下 ,还 存在 另外 一 种 间接 转移 的 形式 。 由 指令 JMP 或 CALL 给 定 的 目标 指 
针 是 特殊 指针 ,并非 直接 指向 代码 段 。 特 殊 指 针 只 有 选择 子 部 分 有 效 , 指 示 调 用 门 、 任 务 门 或 
TSS 描述 符 ,而 偏 移 部 分 不 起 作用 。 对 应 调用 门 ,真正 的 转移 目标 地 址 由 调用 门 给 出 ; 对 应 任 
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务 门 或 TSS 描述 符 ,将 引起 任务 切换 。 

2. 向 目标 代码 段 转移 的 步 县 

综 上 所 述 , 段 间 转 移 的 目标 地 址 必定 含有 选择 子 。 在 执行 上 述 段 间 转 移 指令 ,向 目标 代码 
段 实施 转移 的 过 程 中 ,首先 CPU 根据 该 选择 子 实施 以 下 前 导 步 又 。 

(1) 判断 选择 子 指示 的 描述 符 是 否 为 空 描述 符 。 空 描述 符 将 引起 异常 。 

(2) 判断 选择 子 指示 的 描述 符 是 否 在 对 应 的 描述 符 表 范围 内 。 超 出 对 应 GDT 或 LDT 的 
范围 ,将 引起 异常 。 由 选择 子 内 的 TI 位 ,确定 使 用 GDT 表 还 是 LDT 表 。 

(3) 取得 选择 子 指示 的 描述 符 的 类 型 及 其 他 属性 信息 。 

(4) 判断 上 述 描述 符 的 类 型 是 否 属于 以 下 5 种 类 型 : 非 一 致 代码 段 一致 代 码 段 .调用 门 、 
任务 门 或 者 任务 状态 段 TSS。 不 属于 这 5 种 类 型 ,将 引起 异常 。 

随后 ,CPU 针对 上 述 5 种 情形 分 别处 理 。 它 包括 : 进行 特权 级 相关 检测 ,如 果 违 反 保 护 
规则 ,将 引起 异常 ; 如 果 是 调用 门 , 则 从 调用 门 中 取得 真正 的 目标 地 址 ,并 确定 进入 目标 代码 
段 后 的 CPL; 如 果 是 任务 门 或 者 TSS ,那么 实施 任务 切换 。 

最 后 ,CPU 根据 目标 代码 段 描述 符 信 息 和 目标 地 址 偏 移 ,实施 以 下 收 官 步骤 。 

(1) 判断 目标 代码 段 是 否 存 在 。 目 标 代码 段 描述 符 无 效 , 将 引起 异常 。 

(2) 判断 目标 地 址 偏 移 是 否 越 出 代码 段 。 越 出 目标 代码 段 界限 ,将 引起 异常 。 

(3) 如 果 是 调用 指令 ,把 由 选择 子 和 偏 移 构成 的 返回 地 址 保存 到 堆栈 。 

(4) 把 目标 地 址 选择 子 装载 到 代码 段 寄存 器 CS, 同 时 把 对 应 描述 符 的 信息 装载 到 CS 的 
高 速 缓冲 存储 器 。 

(5) CPL 存 人 CS 内 选择 子 的 RPL 字段 。 

(6) 把 目标 地 址 偏 移 装载 到 指令 指针 寄存 器 EIP。 

上 述 步骤 只 是 对 转移 过 程 的 大 致 说 明 , 实 际 的 动作 细节 还 要 复杂 。 

3. 特权 级 检测 

下 面 对 非 一 致 代码 段 和 一 致 代码 段 的 特权 级 检测 进行 说 明 。 

通常 描述 符 特权 级 DPL 表示 所 描述 存储 段 的 特权 级 ,或 者 访问 该 描述 符 所 需要 的 最 外 层 
特权 级 。 可 以 认为 选择 子 请 求 特权 级 RPL 表示 意愿 ,事实 上 它 由 程序 自己 给 出 。 

对 于 非 一 致 代码 段 , 要 求 CPL 二 DPL,RPL < 二 DPL, 也 即 当 前 特权 级 CPL 与 目标 代码 段 
特权 级 DPL 相同 ,并 且 指 示 目 标 代码 段 的 选择 子 请 求 特权 级 RPL 不 在 外 层 ( 相 同 ,或 者 内 
层 )。 由 此 可 知 , 如 果 直 接 转 移 到 非 一 致 代码 段 ,那么 特权 级 必须 相同 。 

对 于 一 致 代码 段 ,要 求 CPL > 二 DPL, 也 即 当 前 特权 级 CPL 不 在 内 层 (相同 ,或 者 外 层 )。 
由 此 可 知 ,一致 代码 段 描述 符 DPL, 规 定 可 以 转移 到 一 致 的 代码 有 段 的 最 内 层 特权 级 。 因 此 ,3 
级 代码 可 以 转移 到 任何 一 致 代码 段 , 而 0 级 代码 只 允许 转移 到 DPL 等 于 0 的 一 致 代码 段 。 但 
是 ,在 转移 到 一 致 代码 段 时 ,特权 级 保持 不 变 。 值 得 指出 的 是 ,对 于 一 致 代码 段 描述 符 DPL 的 
这 种 解释 ,正好 与 正常 的 DPL 的 解释 相反 。 

一 致 代 码 段 很 特别 ,有 些 子 程序 属于 内 层 , 可 以 供 外 层 程 序 调用 。 例 如 ,处 理 数值 运算 的 
函数 库 。 但 是 ,不 希望 在 执行 内 层 子 程序 的 代码 时 ,改变 当前 特权 级 。 利 用 一 致 代码 段 , 可 以 
做 到 这 点 。 这 是 一 致 代码 段 存在 的 原因 ,所 以 .只 有 外 层 代码 段 才 可 以 转 到 内 层 的 一 致 代 
码 段 。 

4. 任务 内 相同 特权 级 的 转移 

任务 内 相同 特权 级 的 转移 是 指 在 转移 到 目标 代码 段 时 ,当前 特权 级 CPL 保持 不 变 。 
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(1) 利用 段 间 转移 指令 JMP 或 CALL 的 方法 。 利 用 段 间 转移 指令 JMP 或 者 段 间 调用 指 
令 CALL, 实 现任 务 内 相同 特权 级 转移 的 简单 方法 是 : 转移 目标 地 址 的 选择 子 直接 给 出 目标 
代码 段 描述 符 。 如 果 目 标 代 码 段 是 非 一 致 代码 段 , 需 要 保证 CPL 二 DPL, 并 且 RPL < 王 DPL。 
如 果 目 标 代码 段 是 一 致 代 码 段 ,需要 保证 CPL > 二 DPL。 这 样 执行 JMP 或 者 CALL 时 ,实施 
上 述 向 目标 代码 段 转移 的 步 又。 在 顺利 通过 这 些 步骤 后 ,就 完成 任务 内 相同 特权 级 的 转移 。 
在 执行 段 间 调 用 指令 CALL 时 ,会 把 返回 地 址 压 入 堆栈 。 

从 9.4 节 示例 三 源 程序 dp93. asm 可 知 ,在 实施 段 间 转 移 的 JMP 或 者 CALL 指令 中 , 选 
择 子 请 求 特权 级 RPL=0, 目 标 代码 段 描述 符 特权 级 DPL=0, 工 作 程序 运行 的 当前 特权 级 
CPL=0, 所 以 顺利 完成 任务 内 无 特权 级 变换 的 转移 。 

(2) 利用 段 间 返 回 指令 RETF 的 方法 。 通 常情 况 下 , 段 间 返回 指令 RETF 与 段 间 调用 指 
令 CALL 对 应 。 在 利用 段 间 调用 指令 CALL 以 相同 特权 级 的 方式 转移 到 某 个 子 程序 后 ,在 子 
程序 内 利用 段 间 返回 指令 RETF 以 相同 特权 级 的 方式 返回 主 程序 。 例 如 ,在 上 述 示例 三 子 程 
序 代 码 段 中 ,两 个 远 过 程 的 返回 都 是 如 此 。 

特殊 情况 下 , 段 间 返回 指令 RETF 可 以 不 存在 对 应 的 CALL 指令 。 这 时 ,需要 在 堆栈 中 
构建 一 个 用 于 返回 的 环境 。 当 然 ,作为 返回 地 址 的 选择 子 及 所 指示 的 目标 代码 段 描述 符 ,必须 
满足 相应 的 要 求 , 就 像 真 正 发 生 过 调用 一 样 。 

(3) 利用 调用 门 和 其 他 途径 的 方法 。 还 可 以 通过 调用 门 实现 任务 内 相同 特权 级 的 转移 ， 
将 在 9.7. 3 节 中 具体 介绍 。 其 他 实现 任务 内 相同 特权 级 转移 的 途径 ,将 在 9. 8 节 中 介绍 。 

5. 装载 数据 段 和 堆栈 段 寄存 器 时 的 检测 

由 上 述 可 知 ,在 把 指示 代码 段 的 选择 子 装 入 CS 时 ,为 实现 保护 而 进行 的 相关 检测 ,实际 
情况 还 要 复杂 。 下 面 简单 说 明 在 把 选择 子 装 和 数据 段 寄 存 器 和 堆栈 段 寄存 器 时 进行 的 相关 
检测 。 

在 把 非 空 选择 子 装 入 数据 段 寄 存 器 DS、.ES、FS 或 GS 时 ,进行 以 下 保护 检测 。 

(1) 选择 子 指定 的 描述 符 必须 在 对 应 的 描述 符 表 范 围 内 。 

(2) 选择 子 指定 的 描述 符 必须 是 数据 段 描 述 符 或 者 是 可 读 代码 段 。 

(3) 对 于 数据 段 和 可 读 非 一 致 代码 段 , 要 求 CPL < 王 DPL,RPL < 王 DPL。 这 是 访问 数据 
段 描 述 符 时 ,对 特权 级 的 要 求 。 表 明 外 层 不 能 访问 内 层 的 数据 ,但 内 层 能 够 访问 外 层 的 数据 。 

(4) 对 应 段 必 须 存在 。 

如 果 把 空 选择 子 装 入 到 某 个 数据 段 寄存 器 DS、.ES、FS 或 GS, 那 么 就 不 能 引用 该 数据 段 
寄存 器 访问 存储 单元 ,否则 将 引起 异常 。 

在 把 选择 子 装 和 人 堆栈 段 寄存 器 SS 时 ,进行 以 下 保护 检测 。 

(1) 选择 子 不 能 为 空 。 

(2) 选择 子 指定 的 描述 符 必 须 在 对 应 的 描述 符 表 范围 内 。 

(3) 选择 子 指定 的 描述 符 必 须 是 可 读 可 写 数据 段 描 述 符 。 

(4) 要 求 CPL 二 RPL 二 DPL。 这 表明 每 个 特权 级 有 各 自 独 立 的 堆栈 。 

(5) 对 应 段 必须 存在 。 


9.7.2 相同 特权 级 转移 的 演示 (示例 五 ) 


9.4.3 节 示 例 三 在 演示 局 部 描述 符 表 LDT 使 用 的 同时 ,已 经 演示 了 相同 特权 级 的 转移 。 
示例 五 仍然 演示 相同 特权 级 的 转移 ,同时 演示 间接 转移 和 外 层 数据 段 的 使 用 。 示 例 五 的 逻辑 
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功能 是 ,两 次 在 屏幕 指定 位 置 以 十 六 进 制 数 形式 显示 输出 指定 数据 。 

1. 演示 思路 和 执行 步 又 

为 了 简单 化 ,示例 五 没有 安排 局 部 描述 表 LDT 和 中 断 描 述 符 表 IDT, 不 允许 中 断 ,也 不 考 
虑 发 生 异 常 ,不 启用 分 页 存储 管理 机 制 。 为 了 简化 ,当前 特权 级 CPL 始终 等 于 0。 

演示 思路 是 ,采用 一 个 子 程序 以 十 六 进 制 数 形式 显示 输出 双 字 数据 ,显示 位 置 和 数据 作为 
参数 ,由 主 程序 通过 堆栈 传递 给 子 程序 。 示 例 五 包含 一 个 演示 代码 段 DemoCode 和 一 个 子 程 
序 代码 段 SubCode, 还 有 一 个 临时 代码 段 TempCode, 此 外 还 有 实 方式 下 执行 的 代码 部 分 。 为 
了 演示 间接 转移 和 访问 外 层 数据 ,安排 了 一 个 数据 段 ,其 中 含有 两 个 全 指针 变量 ,分 别 指向 子 
程序 和 临时 代码 段 。 

示例 五 的 主要 执行 步骤 如 下 。 

(1) 在 实 方式 下 完成 对 GDT 表 的 初始 化 之 后 ,利用 段 间 转移 指令 JMP 转 入 保护 方式 下 
的 临时 代码 段 TempCode, 处 于 特权 级 0。 

(2) 在 建立 堆栈 后 ,利用 段 间 直 接 转 移 指令 JMP, 转 移 到 演示 代码 段 DemoCode, 特 权 级 
保持 为 0。 

(3) 实现 逻辑 功能 : 第 一 次 利用 段 间 直接 调用 指令 CALL, 调 用 属于 子 程 序 代码 段 
SubCode 的 显示 子 程序 ,特权 级 保持 为 0; 第 二 次 利用 段 间 间接 调用 指令 CALL, 调 用 相同 的 
显示 子 程序 。 在 每 次 调用 显示 子 程序 之 前 ,把 显示 位 置 和 数据 压 人 堆栈 。 

(4) 利用 段 间 间 接 转移 指令 JMP, 转 移 到 临时 代码 段 TempCode, 特 权 级 不 变 。 

(5) 做 返回 实 方式 的 准备 ,并 切换 回 到 实 方式 。 


2. 源 程序 
示例 五 的 源 程序 如 下 : 
演示 任务 内 特权 级 不 变 的 转移 ( 示例 五 ,中 85) 
% include ”DCH" 文件 CH 含有 宏 的 声明 和 符号 常量 等 
section text : 自 text 
bits 16 ;16 位 段 模式 
Head: ;工作 程序 特征 信息 
HEADER end_of_text, Begin, 2000H 
GDTSeg: ;任务 全 局 描述 符 表 GOT 
Dumy DESCRIPIR 00000 :三 描述 符 
Nomal DESCRIPTOR OFFFFH 0.0.ATDN,O 
Nomal_Sel eq Nonrmal- GDTSeg ;规范 段 描述 符 的 选择 子 
InitcDT: ;GT 中 待 初始 化 的 描述 符 起 点 


任务 的 临时 代码 段 的 描述 符 及 其 选择 子 

TerpCode。 CDESCRIPIOR (CFFFFH TOodeSeg 0ATICE0 

Toode Sel eq Tenp0ode- GDTSeg 

:任务 的 演示 代码 段 描 述 符 ( 习 位 段 ) 及 其 选择 子 
Demo0ode。 。 DESCRIPTOR LerDOode- 1.DCodeSeg 0 ATCER+ D32.0 
DCode Sel eq DerCode- GDTSeg 

任务 的 子 程序 代码 段 描述 符 ( 也 位 段 ) 及 其 选择 子 
Sub0ode DESCRIPTOR ”LenSCode- 1, SCodeSeg 0. ATOE+ D32.0 
Soode Sel eq SbCode- DTSeg 
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:任务 的 堆栈 段 描述 符 ( 也 位 段 ) 及 其 选择 子 

DemoStack DESCRIPTOR ”LenStack- 1,StackSeg QAIDIE D32.0 
Stack_Sel equ DemStack- GDTSeg 

:任务 的 数据 段 描述 符 及 其 选择 子 

DemoData DESCORIPIOR LerData- 1,DataSeg OADR+ DR20 ;//@1 
Data Sel equ DemData- GDTSegr RA ;Ma2 

NnDescG6 eqy ($ 一 InitgpT) /8 ;GT 中 待 初始 化 的 描述 符 个 数 
;视频 存储 段 的 描述 符 ( DR= 3) 及 其 选择 子 

VidecMem DESCRIPTOR COFFFFH, 8000H (BH AIDWE DPL3.0 

Wemn Sel equ VideoWam GDTSegr RPL2 

LentDTSeg eqy $ -DlSeg 


aligtb ;16 字 节 对 齐 


:任务 的 子 程序 代码 段 ( 了 2 位 段 ) 
aligtb :16 字 节 对 齐 
bits22 ; 江 位 段 模式 


SCodeSeg: 
;显示 返回 地 址 的 偏 移 部 分 
SibBegin equ $- SCodeSeg 


PUSHEBP 
WN EEP, EP 
MX 以 Wem Sel 
MV ES 俯 ;视频 存储 段 基地 址 000B8000H 
MX I, [EBP+ 19] ;取得 参数 ( 屏幕 位 置 ) Ma3 
MX EX, [EBP+ 1 ;取得 参数 ( 显示 值 ) Ma4 
WA 4 ;显示 颜色 ( 红 底 黄 字 ) 
MN EX 8 ;8 个 十 六 进 制 位 

.LI:ROIL EX 4 
MX AL DO 
AD 人 AL OH ;取得 4 个 二 进 制 位 
ADD AL 30H ; 转 对 应 十 六 进 制 数 ASCINI 码 
OP AL 3 
JEE SHORT .L2 
AD AL 7 

.L2:STOSN ;显示 字符 
LOP.L1 
POP EP 
REF : 段 间 返回 


:任务 的 数据 段 ( pn= 2) 
alighb ;16 字 节 对 齐 
DataSeg: 
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;任务 的 演示 代码 段 ( 了 ?位 段 ) 
aligtb 
bits32 
DCodeSeg: 
DarBegin equ $— DCodeSeg 
MV AX CS 
MN DS, 俯 


MV EAX St 80+ 2 
PUSHEAX 

MX EAX 12345678H 
PUSHEAX 

CALLSCode Sel:SubBegin 
ADD EBP 8 


MDX AX, Data_Sel 
MX G 以 


PUSHDWORD 6+ 80+ 2 
PUSHDWORD CC 87654321H 
CALFAR [GS:PtoSubR] 
AD E 8 


Jp FR [Gs:PtoTCode] 
LerDCode equ $ -DoodeSeg 


:任务 的 临时 代码 段 ( 6 位 段 ) 
aligfi 
bits16 

TOodeSeg: 

PM_Entrylequ $ ~ TOodeSeg 


/5 
/6 


;16 字 节 对 齐 
汉 位 段 模式 


;显示 位 置 ( 第 5 行 首 ) 
; 压 人 堆栈 Ma7 
;假设 的 显示 值 

; 压 和 人 堆栈 Ma8 

;下 接 方 式 ,调用 子 程序 


;用 于 数据 段 //@9 
;显示 开始 位 置 ( 第 6 行 首 ) 


;假设 的 显示 值 
;间接 方式 ,调用 子 程序 


;间接 方式 , 转 入 临时 代码 段 


;16 字 节 对 齐 
:16 位 段 模式 


;可 省 略 


:直接 方式 , 转 入 演示 代码 段 
;准备 切换 回 实 方式 


:把 规范 段 描述 符 





; 实 方式 的 代码 
bits16 

Begin: 
aD 
MA CS 
MX DS, MX 
MV [ToReal+ 3], MX 
MV [VarESP], ESP 
MN [Varss], SS 
MX SI，InitGDT 
MV C NnDescG 
CAL InitDescBA 
MX SI，VGDTR 
MV BEX, GDTSeg 
CAL InitPeDesc 


LEDTIVWEDIR] 
CLI 


% include” PROC AM" 
end_of text: 


;准备 返回 实 方式 


;真正 回 到 实 方式 


;gDT 伪 描述 符 
活 存 实 方式 的 堆栈 指针 


重 定位 
;保存 实 方式 下 堆栈 指针 


;设置 吓 中 的 待 初始 化 描述 符 的 基地 址 


初始 化 用 于 GOT 的 伪 描述 符 


;装载 QTR 


;准备 切换 到 保护 方式 


;进入 保护 方式 下 的 临时 代码 段 


; 回 到 实 方式 


:恢复 实 方式 下 的 堆栈 指针 
; 开 中 断 
;返回 加 载 器 


沁 含 初始 化 阶段 的 相关 子 程序 
源 代 码 到 此 为 止 


第 9 章 保护 方式 程序 设计 上 409 





3. 关于 示例 五 的 说 明 

下 面 结 合 源 程序 对 示例 五 进行 说 明 , 重 点 是 相同 特权 级 的 转移 ,这 些 段 间 转 移 可 以 分 为 直 
接 转移 间接 转移 、 直 接 调用 和 间接 调用 等 情形 。 

(1) 由 直接 转移 指令 JMP 实现 的 转移 。 在 临时 代码 段 TempCode, 利 用 如 下 段 间 直接 转 
移 指 令 ,转移 到 演示 代码 段 DemoCode。 

JP DOode Sel:DanoBegin 

上 述 指令 中 转移 目标 地 址 的 选择 子 DCode_Sel 指定 一 个 非 一 致 代码 段 , 且 其 描述 符 特权 
级 DPL 一 0。 该 选择 子 的 RPL 二 0, 当 前 特权 级 CPL 二 0。 因 此 符合 CPL=DPL, 且 RPL <= 
DPL 的 要 求 。 所 以 可 以 顺利 进行 相同 特权 级 的 转移 : 把 目标 代码 段 的 选择 子 DCode_Sel 装 
入 CS, 并 保持 当前 特权 级 ,同时 把 对 应 描述 符 中 的 信息 装 入 CS 的 高 速 缓冲 存储 器 ; 把 目标 地 
址 偏 移 DemoBegin 装 入 指令 指针 寄存 器 EIP。 

(2) 由 间接 转移 指令 JMP 实现 的 转移 。 工 作 程 序 完成 逻辑 功能 后 , 从 演示 代码 段 
DemoCode, 利 用 如 下 段 间 间接 转移 指令 JMP, 转 移 到 临时 代码 段 TempCode, 为 了 充分 演示 ， 
故意 如 此 安排 。 

JWP FAR [Gs:PtolCode] ;故意 使 用 GB 寄存 器 ,作为 段 超越 前 级 

上 述 转移 指令 只 是 给 出 了 含有 转移 目的 地 址 的 存储 单元 PtoTCode, 所 以 是 间接 转移 。 从 
源 程序 可 见 ,存储 单元 PtoTCode 是 数据 段 DemoData 中 的 一 个 指针 变量 ,如 下 所 示 , 含 有 一 
个 48 位 全 指针 。 

D MEntry2 ; 乌 位 偏 移 
DN Tode Sel ;目标 段 选择 子 

上 述 段 间 间接 转移 指令 JMP, 类 似 于 如 下 的 段 间 直接 转移 指令 。 
JP TOode Sel: FL_Entry2 

从 源 程序 可 知 ,选择 子 的 RPL=0, 目 标 代码 段 是 非 一 致 代码 段 , 其 描述 符 DPL 二 0。 当 前 
特权 级 CPL==0, 所 以 能 够 顺利 进行 相同 特权 级 的 转移 。 

(3) 由 直接 调用 指令 CALL 实现 的 转移 。 在 演示 代码 段 DemoCode, 利 用 如 下 段 间 直 接 
调用 指令 ,调用 子 程序 代码 段 SubCode 中 的 显示 子 程序 ,实现 工作 程序 的 逻辑 功能 。 

CAL SCode Sel:SubBegin 

上 述 指令 中 转移 目标 地 址 的 选择 子 SCode_Sel 指定 一 个 非 一 致 代码 段 , 且 其 描述 符 特权 
级 DPL= 二 0。 该 选择 子 的 RPL 二 0, 当 前 特权 级 CPL= 二 0。 因 此 符合 CPL=DPL, 且 RPL < 一 
DPL 的 要 求 。 所 以 可 以 顺利 进行 相同 特权 级 的 转移 进入 子 程序 : 把 返回 地 址 的 CS 和 EIP 作 
为 两 个 双 字 压 入 堆栈 ; 把 目标 代码 段 的 选择 子 SCode_Sel 装 入 CS, 并 保持 当前 特权 级 ; 把 目 
标 地 址 偏 移 SubBegin 装 入 指令 指针 寄存 器 EIP。 

(4) 由 间接 调用 指令 CALL 实现 的 转移 。 为 了 充分 演示 ,还 安排 了 如 下 段 间 间接 调用 指 
令 ,调用 显示 子 程序 。 

CAL FAR [GS:PtoSbR] ; 故意 使 用 段 寄 存 器 68, 作为 段 超越 前 组 

该 调用 指令 给 出 了 含有 目标 地 址 的 存储 单元 PtoSubR ,所 以 是 间接 调用 。 从 源 程序 行 
“//@5” 和 “//@6” 可 知 ,存储 单元 LPtoSubR 含有 一 个 48 位 的 指针 ,因此 该 段 间 间接 调用 指 
令 类 似 于 如 下 的 段 间 直接 调用 指令 。 





CAL SCode Sel: SubBegin 

这 与 上 述 (3) 一 样 ,不 再 闭 述 。 

(5) 关于 数据 段 的 特权 级 检测 。 为 了 演示 加 载 数据 段 寄 存 器 时 的 特权 级 检测 ,有 意 安排 
了 数据 段 DemoData, 其 描述 符 的 特权 级 DPL 一 2 ,参见 源 程序 *//@1” 行 。 从 源 程序 可 知 , 在 
该 数据 段 中 安排 了 两 个 指针 变量 。 为 了 引用 这 两 个 指针 变量 ,充分 演示 段 间 间 接 转 移 , 在 演示 
代码 段 中 事先 把 指向 该 数据 段 的 选择 子 加 载 到 段 寄 存 器 GS, 参 见 源 程序 “//@9” 行 。 对 应 选 
择 子 的 RPL = 1, 参见 源 程序 “//@2” 行 。 因 此 符合 
CPL < 二 DPL, 且 RPL<==DPL 的 要 求 ,能 够 顺利 加 载 GS 
参数 显示 位 置 | 。 ,ij。 寄存 器 。 
参数 显示 数据 | ,1 在 显示 子 程序 中 把 指向 视频 存储 区 描述 符 的 选择 子 加 
返回 地 址 CS 载 到 ES 寄存 器 ,关于 保护 检测 的 分 析 , 留 为 作业 。 
返回 地 址 EIP (6) 由 堆栈 传递 参数 。 根 据 约定 演示 程序 把 显示 位 置 

Ee EBP ”和 显示 数据 通过 堆栈 传递 给 显示 子 程序 ,参见 源 程序 “//@7” 
和 *//@8” 行 。 在 进入 显示 子 程序 获取 参数 之 时 ,堆栈 如 
图 9. 25 所 示 。 所 以 可 以 根据 指针 EBP 方便 地 从 堆栈 获取 
图 9. 25 示例 五 堆栈 示意 图 。 参数 ,参见 源 程序 *//@3” 和 *//@4" 行 。 


9.7.3 任务 内 不 同 特权 级 的 变换 


在 一 个 任务 之 内 ,可 以 存在 4 个 特权 级 ,任务 运行 时 一 般 会 发 生 不 同 特权 级 之 间 的 变换 。 
例如 ,外 层 的 应 用 程序 调用 内 层 操 作 系 统 的 例 程 ,以 获得 必要 的 诸如 存储 器 分 配 等 系统 服务 ; 
内 层 操 作 系 统 的 例 程 完成 后 ,返回 到 外 层 应 用 程序 。 

在 任务 内 部 ,特权 级 从 外 层 到 内 层 变 换 的 一 般 途 径 是 ,使 用 段 间 调用 指令 CALL ,通过 调 
用 门 实施 转移 ; 特权 级 从 内 层 到 外 层 变 换 的 一 般 途径 是 ,使 用 段 间 返回 指令 RETF。 注 意 ,不 
能 利用 JMP 指令 实现 任务 内 不 同 特 权 级 的 变换 。 

1. 通过 调用 门 的 转移 

当 段 间 转 移 指 令 JMP 或 段 间 调 用 指令 CALL 给 定 的 目标 地 址 选择 子 , 指 示 调 用 门 描述 
符 时 ,表示 通过 调用 门 进行 转移 。 调 用 门 描 述 调 用 转移 的 入 口 点 ,从 图 9. 23 可 知 , 它 包含 由 目 
标 地 址 的 段 选择 子 和 偏 移 组 成 的 48 位 全 指针 。 在 通过 调用 门 转移 时 ,真正 的 转移 目标 地 址 是 
调用 门 内 的 48 位 全 指针 。 原 目标 地 址 中 的 选择 子 只 是 给 出 调用 门 , 而 原 目 标 地 址 的 偏 移 被 丢 
弃 。 这 是 保护 方式 下 的 另 一 种 间接 转移 。 如 9.7. 1 节 所 述 ,在 执行 段 间 转 移 指 令 ,实施 到 前 导 
步骤 (4) 时 ,会 确定 是 否 是 通过 调用 门 的 转移 。 

在 访问 调用 门 取得 真正 目标 地 址 时 ,CPU 会 先进 行 特 权 级 检测 。 访 问 门 描述 符 的 特权 级 
要 求 与 访问 数据 段 描 述 符 一 样 。 门 描述 符 DPL 规定 了 访问 门 的 最 外 层 特权 级 ,只 有 在 相同 级 
或 者 更 内 层级 的 程序 才 可 以 访问 门 ,也 即 CPL < 二 DPL。 同 时 ,还 要 求 指示 门 的 选择 子 RPL 
必须 满足 RPL < 二 DPL 的 条 件 。 调 用 门 是 门 描述 符 的 一 种 。 因 此 ,只 有 CPL <==DPL, 且 
RPL < 二 DPL, 才 能 从 调用 门 获取 到 真正 的 目标 地 址 。 

在 从 调用 门 获取 到 目标 地 址 后 ,继续 实施 向 目标 地 址 的 转移 。 期 间 , 还 要 根据 真正 的 目标 
代码 段 进行 特权 级 检测 。 目 标 代码 段 分 为 一 致 代码 段 和 非 一 致 代码 段 两 类 ,指令 又 分 为 转移 
指令 JMP 和 调用 指令 CALL 两 类 ,这 些 对 特权 级 的 要 求 并 不 一 样 。 由 于 通过 调用 门 进行 转 
移 , 因 此 不 再 考虑 选择 子 中 的 请 求 特 权 级 RPL。 
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先 说 明 目 标 代码 段 是 一 致 代码 段 的 情况 。 通 过 调用 门 ,只 能 由 外 层 的 代码 转移 到 内 层 或 
者 同 层 的 一 致 代码 段 ,而 且 特 权 级 并 不 变换 。 所 以 ,无 论 指令 JMP 或 指令 CALL ,都 要 求 CPL 
> 一 DPL。 这 里 的 DPL 是 真正 目标 代码 段 的 DPL ,不 是 调用 门 的 DPL。 

接 下 来 针对 指令 JMP 和 指令 CALL, 分 别 说 明 目 标 代码 段 是 非 一 致 代码 段 的 情况 ,其 中 
的 DPL 是 真正 目标 代码 段 的 DPL .不 是 调用 门 的 DPL。 

对 于 段 间 转移 指令 JMP, 如 果 目 标 代码 段 是 非 一 致 代码 段 ,那么 要 求 CPL 二 DPL, 此 即 表 
示 目 标 代码 段 的 特权 级 必须 与 当前 特权 级 相同 。 因 此 ,虽然 段 间 转移 指令 JMP 可 以 通过 调用 
门 进行 转移 ,但 不 能 改变 特权 级 。 

对 于 段 间 调用 指令 CALL, 如 果 目 标 代 码 段 是 非 一 致 代码 段 , 那 么 要 求 CPL >==DPL, 此 
即 表示 可 以 由 外 层 代 码 调用 内 层 的 代码 。 如 果 CPL=DPL ,表示 目标 代码 段 的 特权 级 与 当前 
特权 级 相同 ,属于 同 层 调用 ,不 改变 特权 级 ,随后 的 转移 实施 步骤 类 似 于 9.7. 1 节 所 述 的 直接 
调用 。 如 果 CPL > DPL ,那么 就 意味 着 发 生 特权 级 变换 的 调用 ,也 即 外 层 代 码 调用 了 内 层 的 
代码 ,并 且 当 前 特权 级 由 外 层 变 换 到 内 层 。 

综 上 所 述 ,使 用 段 间 调 用 指令 CALL, 通 过 调用 门 可 以 实现 从 外 层 代 码 调 用 进入 内 层 代 
码 ; 通过 调用 门 也 可 实现 特权 级 不 变 的 转移 。 

当然 ,CALL 指令 在 最 后 把 目标 代码 段 地 址 装 入 CS 和 EIP 之 前 ,要 把 原 CS 和 EIP, 即 返 
回 地 址 保存 到 堆栈 。 如 果 特 权 级 不 变 , 那 么 堆栈 保持 不 变 ,返回 地 址 就 保存 在 原 堆栈 中 ; 如 果 
变换 特权 级 ,那么 返回 地 址 保存 在 内 层 堆 栈 中 。 

2. 堆栈 的 切换 

在 使 用 CALL 指令 ,通过 调用 门 向 内 层 转 移 时 ,不 仅 特权 级 发 生变 换 ,控制 转移 到 一 个 新 
的 代码 段 ,而 且 也 切换 到 内 层 的 堆栈 段 。 从 图 9. 24 所 示 的 任务 状态 段 TSS 的 格式 可 见 ,TSS 
中 包含 有 指向 0 级 .1 级 和 2 级 堆栈 的 指针 。 在 特权 级 发 生 向 内 层 变 换 时 ,根据 特权 级 使 用 
TSS 中 相应 的 堆栈 指针 对 SS 及 ESP 寄存 器 进行 初始 化 ,建立 起 一 个 空 栈 。 

在 建立 起 内 层 堆 栈 后 , 先 把 外 层 堆栈 的 指针 SS 及 ESP 寄存 器 的 值 压 入 内 层 堆栈 ,以 使 得 
相应 的 向 外 层 返 回 可 恢复 原来 的 外 层 堆栈 。 然 后 ,从 外 层 堆栈 复制 以 双 字 为 单位 的 调用 参数 
到 内 层 堆栈 ,调用 门 中 的 Count 字段 值 决定 了 复制 参数 的 量 。 这 些 被 复制 的 参数 是 主 程序 通 
过 堆栈 传递 给 子 程序 的 实 参 ,在 调用 之 前 被 压 人 外 层 堆栈 。 通 过 复制 堆栈 中 的 参数 ,使 内 层 的 
子 程序 不 需要 考虑 堆栈 的 切换 ,而 容易 地 访问 主 程序 传递 过 来 的 实 参 。 最 后 ,调用 的 返回 地 址 
被 压 入 堆栈 ,以 便 在 调用 结束 时 返回 。 图 9. 26 给 出 了 在 向 内 层 变换 时 ,建立 内 层 堆 栈 ,并 从 外 
层 堆 栈 复 制 两 个 双 字 参数 到 内 层 堆栈 的 示意 图 。 图 中 每 项 是 双 字 ,可 见 的 段 寄 存 器 内 的 选择 
子 被 扩展 成 32 位 ,高 16 位 为 0。 无 论 是 否 通过 调用 门 , 只 要 不 发 生 特权 级 变换 ,就 不 会 切换 
堆栈 。 

3. 向 外 层 返 回 

与 使 用 段 间 调用 指令 CALL 通过 调用 门 向 内 层 变 换 相 反 , 使 用 段 间 返 回 指令 RETF 实现 
向 外 层 返回 。 指 令 RETF 从 堆栈 中 弹出 返回 地 址 ,并 且 可 以 采用 调整 ESP 的 方法 , 跳 过 相应 
的 在 调用 之 前 压 人 堆栈 的 参数 。 返 回 地 址 的 选择 子 指示 要 返回 的 代码 段 描 述 符 ,从 而 确定 返 
回 的 代码 段 。 选 择 子 的 RPL 确定 返回 后 的 特权 级 ,而 不 是 对 应 描述 符 的 DPL, 这 是 因为 指令 
RETER 可 能 使 控制 返回 到 一 致 代码 段 , 而 一 致 代码 段 可 以 在 DPL 规定 的 特权 级 以 外 的 特权 级 
执行 。 

可 以 简单 认为 ,指令 RETF 首先 从 堆栈 弹出 返回 地 址 。 如 果 返 回 地 址 的 选择 子 的 RPL 
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规定 相对 于 CPL 更 外 层 的 级 ,那么 就 引起 向 外 层 返 回 。 其 次 ,为 向 外 层 返 回 , 跳 过 内 层 堆栈 中 
的 参数 ,再 从 内 层 堆 栈 中 弹出 指向 外 层 堆栈 的 指针 ,并 装 人 到 SS 及 ESP, 以 恢复 外 层 堆 栈 。 
再 次 ,调整 ESP, 跳 过 在 相应 的 调用 之 前 压 入 到 外 层 堆栈 的 参数 。 然 后 ,检查 数据 段 寄存 器 
DS、ES、FS 及 GS, 以 保证 寻 址 的 段 在 外 层 是 可 访问 的 ,如 果 段 寄存 器 寻 址 的 段 在 外 层 是 不 可 
访问 的 ,那么 装 和 人 空 选择 子 , 以 避免 在 返回 时 发 生 保护 空洞 。 最 后 ,返回 (外 层 ) 继 续 执行 。 上 
述 5 步 是 对 带 立 即 数 段 间 返回 指令 而 言 的 ,立即 数 规定 了 堆栈 中 要 跳 过 的 参数 的 字 节 数 。 对 
无 立即 数 段 间 返回 指令 而 言 ,缺少 第 二 步 和 第 三 步 ,请 参见 下 面 的 示例 六 。 如 果 RETF 指令 
不 需要 向 外 层 返 回 ,那么 就 只 有 开始 和 最 后 的 两 步 。 
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图 9.26 向 内 层 变 换 时 堆栈 切换 示意 图 


9.7.4 特权 级 变换 的 演示 (示例 六 ) 


下 面 给 出 演示 任务 内 特权 级 变换 的 示例 六 。 示 例 六 主要 演示 任务 内 的 特权 级 变换 。 示 例 
六 的 逻辑 功能 是 , 巾 子 程序 显示 输出 主 程序 的 特权 级 。 

1. 演示 内 容 和 执行 步 又 

为 了 简单 化 ,示例 六 没有 安排 中 断 描述 符 表 IDT ,不 允许 中 断 ,也 不 考虑 发 生 异 常 ,不 启用 
分 页 存储 管理 机 制 。 演 示 内 容 包 括 : 通过 调用 门 从 外 层 特权 级 变换 到 内 层 特权 级 ; 通过 段 间 
返回 指令 从 内 层 特权 级 变换 到 外 层 特权 级 ; 还 演示 任务 状态 段 TSS 的 使 用 和 局 部 描述 符 表 
LDT 的 使 用 。 

演示 思路 是 ,外 层 的 主 程序 调用 内 层 的 子 程序 ,由 子 程序 从 堆栈 中 的 返回 地 址 分 析出 外 层 
主 程序 的 特权 级 ,并 显示 输出 特权 级 。 示 例 六 包含 一 个 过 渡 代 码 段 InteCode、 一 个 演示 代码 
段 DemoCode 和 一 个 子 程序 代码 段 SubCode, 还 有 一 个 临时 代码 段 TempCode, 此 外 还 有 实 方 
式 下 执行 的 代码 部 分 。 

示例 六 的 主要 执行 步 又 如 图 9. 27 所 示 。 在 图 的 右边 标 出 了 特权 级 变换 的 分 界 情况 。 由 
于 在 任务 内 发 生 特权 级 变换 时 要 切换 堆栈 ,而 内 层 堆 栈 的 指针 存放 在 当前 任务 的 TSS 中 , 因 
此 在 进入 保护 方式 后 设置 任务 状态 段 寄 存 器 TR。 由 于 演示 任务 使 用 了 局 部 描述 符 表 LDT， 
因此 设置 LDTR。 从 实 方式 切换 到 保护 方式 下 的 16 位 临时 代码 段 ,CPL 二 0。 在 临时 代码 段 
通过 调用 门 转移 到 32 位 过 渡 代 码 段 ,不 发 生 特 权 级 变换 ,CPL 一 0。 为 了 演示 外 层 程 序 通 过 调 
用 门 调用 内 层 程 序 , 要 使 CPL > 0。 本 示例 先 通 过 段 间 返回 指令 RETF 从 特权 级 0 变换 到 特 
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权 级 3 的 演示 代码 段 。 在 特权 级 3 下 ,通过 调用 门 来 调用 1 级 的 子 程序 。 随 着 执行 段 间 
RETF ,又 返回 到 3 级 的 演示 代码 段 。 在 3 级 演示 代码 段 通过 调用 门 转 移 到 0 级 的 过 渡 代码 
段 , 再 转移 到 0 级 的 临时 代码 段 , 最 后 切换 回 实 方式 。 
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准备 返回 实 方式 特权 级 0 
1 
切换 回 实 方式 QQ 

















实 方式 下 的 恢复 工作 














结束 
图 9.27 示例 六 的 主要 执行 步骤 


2. 源 程序 

除了 工作 任务 特征 信息 外 ,示例 六 由 以 下 几 部 分 组 成 。 

(1) 全 局 描述 符 表 GDT。GDT 含有 任务 的 TSS 段 描述 符 和 LDT 段 描述 符 , 此 外 还 含有 
临时 代码 段 描述 符 、 规 范 数据 段 描述 符 和 视频 存储 区 有 段 描述 符 。 

(2) 任务 的 LDT 段 。 它 含有 除 临 时 代码 段 外 的 其 他 代码 段 的 描述 符 和 演示 任务 各 级 堆 


栈 段 描述 符 ,还 含有 3 个 调用 门 。 
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(3) 任务 的 TSS 段 。 

(4) 任务 的 0 级 .1 级 和 3 级 堆栈 段 。 这 些 堆栈 段 都 是 32 位 段 。 

(5) 任务 的 子 程序 代码 段 , 不 仅 含 有 代码 ,还 含有 数据 。32 位 代码 段 ,特权 级 1 。 
(6) 任务 的 演示 代码 段 。32 位 代码 段 , 特 权 级 3 。 

(7) 任务 的 过 渡 代 码 段 。32 位 段 , 特 权 级 0。 

(8) 临时 代码 段 。16 位 段 ,特权 级 0。 

(9) 实 方式 下 的 数据 和 代码 段 。 


示例 六 的 源 程序 如 下 : 

;演示 任务 内 特权 级 变换 的 转移 ( 示例 六 , do96) 

% include  ”DVCH" 文件 CH 含有 宏 的 声明 和 符号 常量 等 
section text : 段 text 
bits 16 ;6 位 段 模式 

Head: ;工作 程序 特征 信息 
HEADER end_of_text, Begin, 2000H 

prseg: :任务 全 局 描述 符 表 GDT 

Dmy DESCRIPIR 00000 ; 哑 描 述 符 

Nomal DESCRIPTOR ”OFFFFHOOQATIW0 

Nomal_Sel eq Nomal- GDTSeg ;规范 段 描述 符 的 选择 子 

InitGDT: ;GT 中 待 初始 化 的 描述 符 


;工作 任务 138 段 的 描述 符 ( DR=0) 及 其 选择 子 
DemoTSS DESCRIPTOR LenTSS- 1, TSSeg 0 ATTSS32.0 
TSS sel equ ”DamoTSS- GDTSeg 

;工作 任务 DT 段 的 描述 符 ( pn= 0) 及 其 选择 子 
DenoLDT DESCRIPTOR_LenLD- 1, LDTSeg 0 ATLDT,O 
LDT_ sel equ DanocLDT- GDTSeg 

活 时 代码 段 的 描述 符 ( DR= 0) 及 其 选择 子 
TempCode DESCRIPTOR (FFFFH TOSeg 0 ATCE.O 

TOode Sel eq TanCode- GDTSeg 

NnDescG eq ($-InitoT) £8 ;pT 中 待 初始 化 的 描述 符 个 数 
;视频 存储 段 的 描述 符 ( DR= 3) 及 其 选择 子 
Videdem DESCRIPTOR OFFFFH 8000H, CBH ATDW DPL30 


LDTSeg: ;工作 任务 局 部 描述 符 表 LOT 
;工作 任务 的 0 级 堆栈 段 描述 符 (名 位 段 ,DR=0) 及 其 选择 子 
DemStack0 。 DESCRIPTOR LenStackO- 1, Stack(Seg 0 ATDW D32.0 

Stack0 Sel eq (DeroStack0- LDTSeg)+ TIL 

;工作 任务 的 1 级 堆栈 段 描述 符 ( 也 位 段 ,DR= 1) 及 其 选择 子 
DemoStack1 。 DESCRIPTOR ”LenStackl- 1, StacklSeg 0 AIDWF D32+ DPL1,0 

Stackl_ Sel eq (DeroStackt- LDTSeg) + TIL+ RPL 

;工作 任务 的 3 级 堆栈 段 描述 符 ( DR=3) 及 其 选择 子 

DemStack3 。” DESCRIPTOR ”LenStack3- 1, Stack3Seg 0 AIDW DB2r DPL3.0 

Stack3 Sel eq (DeroStack3- LDTSeg)+ TIL+ RRL3 
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;演示 代码 段 描述 符 ( 也 位 段 ,DR= 3) 及 其 选择 子 

DeroCode CDESCRIPTOR LerDCode- 1,DCodeSeg QATCE32r DPL3.0 
DOode Sel ”equ (Damo0ode- LDTSeg)+ TIL+ RPL3 

;过 渡 代 码 段 描述 符 ( 2 位 段 ,DR= 0) 及 其 选择 子 

InteCode © DESCRIPTOR LenlCode- 1 ICodeSeg 0ATCE22 0 

ICode Sel equ (InteCode-LDTSeg)+TIL 

浮 程 序 代码 段 描 述 符 ( 也 位 段 ,bpR=1T) 及 其 选择 子 
SubCode DESCRIPTOR ”LenSCode- 1, SCodeSeg 0 ATCER+ De2+ DPL10 
SCode Sell equ (Subcode-LDTSeg)+TILE RALT 

SCode Sel3 eq (SibCode-IDTSeg)+TIL+ RA3 :Mal 
NnDesd. eq ($-LDlSeg) /8 :DT 中 需要 初始 化 的 描述 符 个 数 
指向 过 渡 代 码 段 内 ICBegin 点 的 调用 门 (DR=2) 

PTGateA GATE ”1CBegin ICode_Sel, 0 ATOGAT32+ DPL2.0 
PTGateA Sel equ (PlateA-IDTSeg)+TIL+RAI  ;//@2 
;指向 过 渡 代 码 段 内 ICodeEnd 点 的 调用 门 ( DRL= 3) 

PTGateB GATE ”ICodeEnd ICode Sel,QATOGAT32r DpP30 ;Ma3 
PTGateB Sel equ (PrGateB-LDTSeg)+TILERPR2 ;Ma4 

;指向 显示 子 程序 的 调用 门 (DA= 3) 

PSubGate GAIE SubBegin SCode Sel3 0ATOGAT32+ DPL3.0 

PSGate Sel eq (PSubGate- LDTSeg)+ TIL+ RPL3 





LerLDT eq $-ILDTSeg :LDT 的 长 度 
TSSeg: ;示例 任务 的 状态 段 TS 
Do 00 ;链接 字段 
DD LenStac ;0 级 堆栈 指针 
DN Stac0 Sel,0 初始 化 
DD Lenstackl 半 级 堆栈 指针 
DN Stackl_sel,0 ;初始 化 
mp 0 ;2 级 堆栈 指针 ( 未 使 用 ) 
DW 00 ;未 初始 化 (未 使 用 ) 
DD 0 ;CR3 
D 0 ;EIP 
D 0 ;ELAGS 
D 0 ;EAX 
D 0 :EX 
mp 0 :EX 
D 0 :EX 
D 0 ;ESP 
mp 0 ;EBP 
D 0 ;ESI 
D 0 ;DI 
DW 00 ;ES 
DW 00 :CS 
DW 00 ;SS 
DW 00 :DS 
DW 00 FS 
DW 00 :G5 
DN IDr Sel,0 :DT 





DW 0 
DO $+2 :指向 I 许可 位 图 
虽 a :lj 许可 位 图 结束 标志 
LenTsS equ $- TSseg 
;工作 任务 的 0 级 堆栈 段 ( 了 位 段 ) 
alin 16 ;6 字 节 对 齐 
StackOSeg: 


LerStadk0 eqy 512 
times LenStackd0 DB 0 
;工作 任务 的 1 级 堆栈 段 ( 了 位 段 ) 

StacklSeg: 
Lenstackl eq 5I2 

times LenStackl DB 0 
;工作 任务 的 3 级 堆栈 段 ( 了 2 位 段 ) 


;工作 任务 的 子 程序 代码 段 ( 也 位 段 ,1 级 ) 


alinm 16 ;6 字 节 对 齐 
bits 2 ;也 位 段 模式 
SCodeSeg: 
Nessage eq $- SQodeSeg 
DB '"CPL=',0 


汪 程 序 代码 段 ( 2 位 段 ,1 级 ) 


;显示 主 调 程序 的 执行 特权 级 
SubBegin eq $- SCodeSeg 
RsH EP 
MX Ep, EP 
MV AX SCode Sel1 浮 程 序 代 码 段 是 可 读 段 
WW DX ;采用 PRL=1 的 选择 子 
MY AX Wem Sel 
MYV EE 以 ;视频 存储 段 基 地 址 是 000B8000H 
MX EI, Sr 80k 2 ;显示 开始 位 置 ( 第 5 行 首 ) 
MO ESI, Message 
WwW AH 4 ; 红 底 黄 字 
L1:LODEB 
RR LA 学 符 串 以 0 结尾 
SHRT.D 
STOSN ;显示 字符 
JWP SHORT .LI 
‘LW EX [EBPr 引 ;从 堆栈 中 取得 主 调 程序 的 CS //@* 
AD AL3 ; 主 调 程序 的 tL 在 G 的 由 LL 字段 
AD AL '0 
MV Ah 4H ; 红 底 黄 字 


STOSW ;显示 
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REF 赣 间 返回 /@5 


:工作 任务 的 演示 代码 段 ( 了 2 位 段 ,3 级 ) 


alin 16 ;6 字 节 对 齐 

bits 32 浊 位 段 模式 
DOodeSeg: 
DOBegin eq $- DCodesSeg 

mR EX EX ; 装 装 样子 ,可 省 略 

CAL PSGate_Sel:345678H ;显示 当前 特权 级 ( 变换 到 1 级 ) Ma6 
DCLab: 

mR EX EX ; 装 装 样子 ,可 省 略 

CAL PreateB Sel:0 ; 转 到 过 渡 代码 段 ( 变换 到 0 级 ) Ma7 


:工作 任务 的 过 渡 代码 段 ( 3 位 段 ,0 级 ) 


alin 16 ;16 字 节 对 齐 
bits 32 ; 没 位 段 模式 
ICodeSeg: 
ICBegin equ $- ICodeSeg 
MY AX Stac Sel 
MY SS, MX ;建立 0 级 堆栈 
MX ”ESP LenStadO 
pu DWORD Stack3_Sel ; 压 人 3 级 堆栈 指针 Ma8 
PUSH DWRD LenStack3 
PUSH DWOFD DCode_ Sel ; 压 入 演示 代码 入 口 点 ( 选择 子 ) 
PUSH DWRD DCBegin ; 偏 移 Ma9 
RETF ; 转 3 级 的 演示 代码 段 /@A 
ICodeEnd equ $- ICodeSeg ; 转 临 时 代码 段 
mR EAX EX ; 装 装 样子 ,可 以 省 略 


:临时 代码 段 ( 16 位 段 ,0 级 ) 


alin 16 ;16 字 节 对 齐 
bits 16 ;6 位 段 模式 
TCseg: 
FM_Ertry1 eq $-TCSeg 
MY AX TSS Sel 
LR 以 ;装载 有 MaB 
MY BX LDT Sel 


ULDT BX ;装载 DIR 





Jp PTGateA_Sel1:9999H ;通过 调用 门 转 过 渡 段 


eq $-TCSeg ;准备 切换 回 实 方式 


ES MX :把 规范 段 描述 符 
; 装 人 各 数据 段 寄 存 器 


可 和 可 页 本 可 本 机 
bd 


? 
间 
凡 
互 
嵌 
兴 
过 
出 


; 


VGDTR PDESC LeneDTSeg- 1,0 :gpT 伪 描述 符 
VarESP DD 0 浙 存 实 方式 的 堆栈 指针 


: 实 方式 的 代码 
bits 16 
Begin: 


ge 


从 CS 

Ds, MX 

[ToReal+ 3], MX 重 定 位 

[VarESP], ESP ;保存 实 方式 下 堆栈 指针 

[Varss], SS 

SI，InitGDT 

CX, NnDescG 

InitDescBA ;设置 GT 中 的 待 初始 化 描述 符 的 基地 址 
Sl, LDTSeg 

CX, NnDescl 

InitDescBA ;设置 LT 中 的 待 初始 化 描述 符 的 基地 址 
SI，VGDTR 

以 GDTSeg 

InitpeDesc ; 彻 始 化 用 于 0T 的 伪 描 述 符 


LWDTR] ;装载 IR 


2 上 ”有 瑟瑟 呈 号 豆 呈 写本 瑟瑟 吾 


EAX CR ;准备 切换 到 保护 方式 


Toode_Sel :PM_Entry1 ;进入 保护 方式 下 的 临时 代码 段 
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Real : ; 回 到 实 方式 

WwW A Cs 

WwW DX 

LSS Esp, [VarESP] :恢复 实 方式 下 的 堆栈 指针 

SIl ; 开 中 断 

FETF ;返回 加 载 器 
% include ”FROC ASM" ;包含 初始 化 阶段 的 相关 子 程序 
end_of_text: 源 代 码 到 此 为 止 


3. 关于 示例 六 的 说 明 

上 述 示 例 六 源 程 序 的 许多 片段 与 前 面 示例 中 的 片段 类 似 , 已 经 作 过 介绍 ,下 面 主要 就 通过 
调用 门 实现 转移 作 些 说 明 ,重点 是 实现 任务 内 特权 级 变换 。 

(1) 通过 调用 门 实现 相同 特权 级 的 转移 。 为 了 充分 演示 ,在 临时 代码 段 安排 如 下 段 间 转 
移 指令 JMP ,通过 调用 门 PTGateA 转移 到 过 渡 代 码 段 。 

JWP PlGateA Sel:99H 

上 述 指令 中 转移 目标 地 址 的 选择 子 PTGateA_Sel, 指 示 如 下 所 示 的 32 位 调用 门 : 

PTGateA GATE ”10Begin ICode Sel, 0 ATOGAT32+ DRL2 0 

由 于 CPL==0, 故 意 安排 选择 子 PTGateA_Sel 中 RPL==1, 参 见 源 程序 “//@2” 行 ,该 调用 
门 描述 符 DPL=2, 符 合 CPL <==DPL, 且 RPL <=DPL 要 求 ,因此 可 以 通过 该 调用 门 。 

由 于 通过 调用 门 转移 ,因此 真正 的 转移 目标 地 址 由 调用 门 给 出 ,转移 指令 中 的 偏 移 部 分 只 
是 一 个 摆设 。 从 上 述 调用 门 可 知 , 真 正 的 转移 目标 地 址 是 ICode_Sel:ICBegin。 对 应 目标 代码 
段 描述 符 如 下 : 

InteCode DESCRIPTOR © LenlCode- 1, ICodeSeg, 0 ATCE32 0 

从 上 述 目标 代码 段 描述 符 可 知 ,目标 代码 段 是 非 一 致 代码 段 ,而 且 DPL==0。 符 合 CPL= 
DPL 的 要 求 ,所 以 可 以 顺利 进行 相同 特权 级 的 转移 : 把 目标 代码 段 的 选择 子 ICode_Sel 装 入 
CS, 并 保持 当前 特权 级 ,同时 把 对 应 描述 符 中 的 信息 装 入 高 速 缓冲 存储 器 ; 把 调用 门 中 的 偏 移 
ICBegin 装 入 指令 指针 寄存 器 EIP。 

(2) 通过 段 间 返回 指令 实现 的 特权 级 变换 。 本 示例 在 两 
处 使 用 段 间 返 回 指令 RETF 实现 任务 内 的 特权 级 变换 。 第 一 
处 在 0 级 的 过 渡 代码 段 中 ,利用 RETF 指令 ,从 特权 级 0 变换 
到 特权 级 3 的 演示 代码 段 ,参见 源 程 序 “//@ A” 行 。 该 处 
RETF 指令 没有 对 应 的 CALL 指令 。 从 实 方式 切换 到 保护 方 
式 后 ,CPL 二 0。 为 了 演示 如 何 通 过 调用 门 来 调用 内 层 程序 ,要 
设法 使 CPL >0。 为 此 ,本 示例 先 建立 一 个 已 发 生 从 外 层 到 内 
层 变 换 的 环境 ,也 即 按 图 9. 26 所 示 的 要 求 ,在 当前 堆栈 (0 级 
堆栈 ) 中 放 入 外 层 堆栈 的 指针 和 外 层 代 码 的 入 口 指针 ,参见 源 
程序 “//@8” 行 到 “//@9” 行 ,形成 一 个 如 图 9. 28 所 示 的 0 级 
堆栈 ,无 须 传递 参数 。 然 后 ,执行 指令 RETF, 从 堆栈 中 弹出 3 
级 演示 代码 的 选择 子 ,RPL 王 3, 而 当时 CPL= 二 0, 所 以 导致 向 
外 层 变 换 特权 级 ,就 从 0 级 的 过 渡 代 码 变换 到 3 级 的 演示 代码 ,同时 切换 到 3 级 堆栈 。 









3 级 堆栈 
段 选择 子 
3 级 堆栈 
栈 顶 偏 移 






3 级 演示 代码 
入 口 偏 移 





00000000 


图 9.28 示例 六 执行 RETF 时 
的 0/1 级 堆栈 
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第 二 处 是 从 1 级 的 子 程序 代码 段 返 回 到 3 级 的 演示 代码 段 , 参 见 源 程序 “//@5” 行 。 这 里 
的 返回 指令 RETF 与 演示 代码 段 中 的 通过 调用 门 的 段 间 调 用 指令 CALL 相对 应 ,参见 源 程序 
“//@6" 行 。 执 行 RETEF 时 的 1 级 堆栈 也 如 图 9. 28 所 示 , 其 中 的 返回 地 址 指针 和 外 层 堆 栈 指 
针 是 当初 在 执行 指令 CALL 时 被 压 人 的。 

(3) 通过 调用 门 实现 的 特权 级 变换 。 本 示例 在 两 处 使 用 了 段 间 调用 指令 ,通过 调用 门 实 
现 特权 级 的 变换 。 第 一 处 是 3 级 演示 代码 通过 调用 门 PSubGate 调用 1 级 的 子 程序 ,参见 源 
程序 “//@6” 行 。 使 用 的 调用 门 如 下 : 

PSubGate GATE SubBegin SCode Sel3 0 ATOGAT32+ DPAL3 0 

从 该 调用 门 可 见 , 调 用 门 自身 DPL=3, 只 有 这 样 ,3 级 的 演示 代码 才能 够 使 用 该 调用 门 。 
真正 的 目标 地 址 是 SCode_Sel3:SubBegin, 对 应 目标 ( 子 程序 ) 代 码 段 描 述 符 如 下 : 

SubCode DESORIPTOR © LenSCode- 1, SCodeSeg 0 ATCER+ DE2+ DAL1, 0 

从 中 可 见 , 子 程序 代码 段 描述 符 DPL= 二 1。 当 时 CPL==3, 所 以 该 调用 引起 从 外 层 特权 级 
向 内 层 特权 级 的 变换 ,使 CPL 二 1。 同 时 形成 如 图 9. 28 所 示 的 1 级 堆栈 。 虽 然 调 用 门 内 的 选 
择 子 SCode_Sel3 的 RPL=3 ,这 是 为 了 演示 有 意 安 排 之 ,大 于 目标 代码 段 描述 符 的 DPL, 但 没 
有 关系 。 

第 二 处 是 3 级 演示 代码 通过 调用 门 PTGateB 调用 0 级 的 过 渡 代 码 , 参 见 源 程序 *//@7” 
行 。 这 里 使 用 的 调用 门 描述 符 DPL 也 等 于 3, 参 见 源 程序 “//@3” 行 。 由 于 调用 门 内 的 选择 
子 ICode_Sel 所 指示 的 过 渡 代 码 段 描述 符 DPL=0, 而 当时 CPL=3, 因 此 引起 从 3 特权 级 向 0 
特权 级 的 变换 ,使 CPL=0。 同 时 形成 如 图 9. 28 所 示 的 0 级 堆栈 。 但 该 处 的 调用 实际 上 是 “有 
去 无 回 ?的 ,调用 的 目的 是 转移 到 0 级 的 过 渡 代码 ,准备 返回 到 实 方式 。 由 于 从 3 级 的 演示 代 
码 段 到 0 级 的 过 渡 代 码 段 要 发 生 特权 级 变换 ,因此 不 能 使 用 转移 指令 JMP, 必 须 使 用 调用 指 
令 CALL。 

(4) 显示 子 程序 的 实现 。 由 子 程序 代码 段 的 显示 子 程序 实现 本 示例 的 逻辑 功能 ,也 即 显 
示 输 出 主 调 程序 执行 时 的 特权 级 。 主 调 程序 的 执行 特权 级 在 代码 段 寄 存 器 CS 内 的 RPL 字 
段 ,在 调用 显示 子 程序 时 ,寄存 器 CS 内 容 被 压 入 堆栈 。 子 程序 从 堆栈 取得 上 述 CS 内 容 , 也 即 
主 调 程 序 的 代码 段 选 择 子 ,参见 源 程序 “//@ * ” 行 ,再 从 中 分 离 出 RPL 字段 就 可 得 主 调 程序 
的 执行 特权 级 。 

(5) 装载 任务 寄存 器 TR。 在 任务 内 发 生 特权 级 变换 时 堆栈 也 随 之 自动 切换 ,外 层 堆栈 指 
针 保 存在 内 层 堆 栈 中 ,而 内 层 堆栈 指针 存放 在 当前 任务 的 TSS 中 。 所 以 ,在 从 外 层 向 内 层 变 
换 时 ,要 访问 任务 状态 段 TSS。 本 示例 在 进入 保护 方式 下 的 临时 代码 段 后 ,通过 加 载 任务 寄 
存 器 指令 LTR ,把 指向 任务 状态 段 TSS 的 选择 子 装载 到 TR 寄存 器 ,参见 源 程序 “//@B” 行 。 

从 源 程 序 可 知 , 通 过 预 置 的 方式 ,准备 好 了 任务 状态 段 TSS。 这 样 可 以 比较 简单 。 


9.7.5 任务 切换 


利用 段 间 转移 指令 JMP 或 者 段 间 调用 指令 CALL., 通 过 任务 门 或 者 直接 通过 任务 状态 
段 , 可 以 切换 到 另 一 个 任务 。 此 外 ,在 中 断 /异常 或 者 执行 中 断 返 回 指令 IRETD 时 也 可 能 发 
生 任 务 切 换 。 

1. 直接 通过 TSS 进行 任务 切换 

当 段 间 转 移 指 令 JMP 或 段 间 调用 指令 CALL 给 定 的 目标 地 址 选择 子 ,指示 一 个 可 用 任 
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务 状态 段 TSS 描述 符 时 ,正常 情况 下 就 发 生 从 当前 任务 到 由 该 可 用 TSS 对 应 任务 (目标 任 
务 ) 的 切换 。 目 标 任务 的 入 口 点 由 目标 任务 TSS 内 的 CS 和 EIP 字段 所 规定 的 指针 确定 。 这 
样 的 JMP 或 CALL 指令 给 定 的 目标 地 址 的 偏 移 被 丢弃 。 

在 访问 TSS 描述 符 获取 任务 状态 段 信息 时 ,CPU 会 先进 行 特权 级 检测 。 访 问 TSS 描述 
符 的 特权 级 要 求 与 访问 数据 段 描述 符 一 样 。TSS 段 描述 符 的 DPL 规定 了 访问 该 描述 符 的 最 
外 层 特权 级 ,只 有 在 相同 级 或 者 更 内 层级 的 程序 才 可 以 访问 它 ,也 即 CPL < 王 DPL。 同 时 ,还 
要 求 指示 它 的 选择 子 的 RPL 必须 满足 RPL < 王 DPL 的 条 件 。 

在 通过 特权 级 检测 后 ,CPU 还 会 进一步 判断 该 TSS 描述 符 是 否 为 可 用 TSS 描述 符 ,以 及 
对 应 TSS 是 否 存在 。 当 这 些 条 件 都 满足 时 ,就 开始 进行 任务 切换 。 

2. 通过 任务 门 进行 任务 切换 

任务 门 内 的 选择 子 指示 某 个 任务 的 TSS 描述 符 , 任 务 门 内 的 偏 移 实 际 上 无 意义 。 

当 段 间 转 移 指 令 JMP 或 段 间 调用 指令 CALL 给 定 的 目标 地 址 选择 子 , 指 示 一 个 任务 门 
时 ,正常 情况 下 就 发 生 任务 切换 ,也 即 从 当前 任务 切换 到 由 任务 门 内 的 选择 子 所 指示 的 TSS 
描述 符 对 应 的 任务 (目标 任务 )。 这 样 的 JMP 或 CALL 指令 给 定 的 目标 地 址 的 偏 移 被 丢弃 。 

在 访问 任务 门 描述 符 时 ,CPU 会 先进 行 特权 级 检测 。 任 务 门 是 门 描述 符 的 一 种 ,对 特权 
级 的 要 求 就 是 访问 门 描述 符 的 要 求 ,其 实 也 就 是 访问 数据 段 描 述 符 的 要 求 。 任 务 门 的 DPL 规 
定 了 访问 该 门 的 最 外 层 特权 级 ,只 有 在 相同 级 或 者 更 内 层级 的 程序 才 可 以 访问 它 。 因 此 ,要 求 
CPL<=DPL, 并 且 RPL<=DPL。 

在 通过 特权 级 检测 后 , 先 从 有 效 的 任务 门 内 取得 指示 目标 任务 TSS 描述 符 的 选择 子 , 再 
做 进一步 的 检查 。 要 求 该 选择 子 指示 GDT 中 的 可 用 TSS 描述 符 , 以 及 对 应 TSS 存在 。 在 通 
过 检测 后 ,就 开始 进行 任务 切换 。 

3. 任务 切换 的 过 程 

根据 指示 目标 任务 TSS 描述 符 的 选择 子 进行 任务 切换 的 过 程 大 致 如 下 。 

(1) 测试 目标 任务 状态 段 的 界限 。TSS 用 于 保存 任务 的 各 种 状态 信息 ,不 同 的 任务 ,TSS 
中 可 以 有 数量 不 等 的 其 他 信息 ,但 根据 图 9. 24 所 示 的 任务 状态 段 基本 格式 ,TSS 的 段 界限 应 
大 于 或 等 于 103。 

(2) 把 寄存 器 现场 保存 到 当前 任务 的 TSS。 把 通用 寄存 器 、 段 寄存 器 、EIP 及 EFLAGS 
的 当前 值 保存 到 当前 TSS 中 。 保 存 的 EIP 的 值 是 返回 地 址 ,指向 引起 任务 切换 指令 的 下 一 条 
指令 。 但 不 把 LDTR 和 CR3 内 容 保存 到 TSS 中 。 

(3) 把 指示 目标 任务 TSS 的 选择 子 装 入 任务 寄存 器 TR。 同 时 ,把 对 应 TSS 描述 符 装 入 
TR 高 速 缓冲 存储 器 中 。 此 后 ,当前 任务 改称 为 原 任 务 , 目 标 任务 改称 为 当前 任务 。 

(4) 基本 恢复 当前 任务 (目标 任务 ) 的 寄存 器 现场 。 根 据 保存 在 TSS 中 的 内 容 ,恢复 各 通 
用 寄存 器 、 段 寄存 器 、EFLAGS 及 EIP。 在 装 入 段 寄存 器 的 过 程 中 ,为 了 能 正确 地 处 理 可 能 发 
生 的 异常 ,只 把 对 应 选择 子 装 和 各 段 寄 存 器 。 还 装载 CR3 寄存 器 。 

(5) 进行 链接 处 理 。 如 果 需 要 链接 ,那么 将 指向 原 任务 TSS 的 选择 子 写 人 当前 任务 TSS 
的 链接 字 字 段 ,把 当前 任务 TSS 描述 符 类 型 改 为 “ 忙 ”, 并 将 标志 寄存 器 EFLAGS 中 的 标志 
NT 置 1, 表 示 是 嵌 套 任务 。 如 果 需 要 解 链 ,那么 把 原 任 务 TSS 描述 符 类 型 改 为 “可 用 ”。 如 果 
无 链接 处 理 ,那么 将 原 任 务 TSS 描述 符 类 型 置 为 “可 用 ”, 当前 任务 TSS 描述 符 类 型 置 为 
“ 忙 ”"。 由 JMP 指令 引起 的 任务 切换 不 实施 链接 或 解 链 处 理 ; 由 CALL 指令 .中 断 .IRETD 指 
令 引 起 的 任务 切换 要 实施 链接 或 解 链 处 理 。 
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(6) 把 CR0 中 的 TS 位置 为 1。 这 表示 已 发 生 过 任务 切换 ,在 当前 任务 使 用 协 处 理 器 指令 
时 ,产生 自 陷 。 由 自 陷 处 理 程序 完成 有 关 协 处 理 器 现场 的 保存 和 恢复 。 这 有 利于 快速 地 进行 
任务 切换 。 

(7) 把 TSS 中 的 CS 选择 子 的 RPL 字段 作为 当前 任务 特权 级 设置 为 CPL。 任 务 切换 可 
以 在 一 个 任务 的 任何 特权 级 发 生 ,并 可 切换 到 另 一 任务 的 任何 特权 级 。 

(8) 装载 LDTR 寄存 器 。 一 个 任务 可 以 有 自己 的 LDT, 也 可 以 没有 。 当 任务 没有 LDT 
时 ,TSS 中 LDT 选择 子 为 空 (0)。 如 果 TSS 中 LDT 选择 子 非 空 , 则 从 GDT 中 读 出 对 应 LDT 
描述 符 , 在 经 过 测试 后 ,把 所 读 LDT 描述 符 装 入 LDTR 高 速 缓冲 寄存 器 。 如 果 LDT 选择 子 
为 空 ,表明 任务 不 使 用 LDT。 

(9) 装载 代码 段 寄 存 器 CS、 堆 栈 段 寄存 器 SS 和 各 数据 段 寄 存 器 及 其 它们 的 高 速 缓冲 存 
储 器 。 

(10) 把 排 错 寄 存 器 DR7 中 的 局 部 启用 位 设置 为 0, 以 清除 局 部 于 原 任务 的 各 个 断 点 和 
方式 。 

由 于 需要 处 理 任 务 切换 过 程 中 出 现 异 常 的 情况 ,因此 实际 的 任务 切换 过 程 要 复杂 得 多 。 
由 此 可 知 ,表面 上 可 以 方便 地 切换 任务 ,实际 上 这 种 * 硬 ”切换 方式 将 花费 大 量 时 间 。 

4. 关于 任务 状态 和 嵌 套 的 说 明 

从 表 9.5 可 知 , 有 “可 用 ”和 *“ 忙 ”两 类 任务 状态 段 TSS 描述 符 。 它 们 反映 了 对 应 任务 的 当 
前 状态 。 标 志 寄 存 器 EFLAGS 中 有 一 个 标志 位 NT( 位 14) , 它 反映 是 否 出 现任 务 典 套现 象 。 
标志 NT=1 表示 任务 嵌 套 ,当前 任务 链接 到 前 一 任务 ; 标志 NT=0 表示 当前 任务 不 链接 其 
他 任务 。 

在 由 段 间 转移 指令 JMP 引起 任务 切换 时 ,不 实施 链接 ,不 会 导致 任务 的 嵌 套 。 它 要 求 目 
标 任 务 是 “可 用 ”任务 。 切 换 过 程 中 把 原 任务 置 为 “可 用 ”, 目 标 任务 置 为 “ 忙 ”。 

在 由 段 间 调用 指令 CALL 引起 任务 切换 时 ,实施 链接 ,导致 任务 的 嵌 套 。 它 要 求 目 标 任 
务 是 “可 用 ”任务 。 在 切换 过 程 中 把 目标 任务 置 为 “ 忙 ”, 原 任务 仍 保 持 “ 忙 >; 标志 寄存 器 
EFLAGS 中 的 标志 NT 置 1, 表 示 是 典 套 任务 。 

在 由 中 断 或 异常 引起 任务 切换 时 ,实施 链接 ,导致 任务 的 嵌 套 。 要 求 目 标 任 务 是 “可 用 ” 任 
务 。 在 切换 过 程 中 把 目标 任务 置 为 “ 忙 ”, 原 任务 仍 保持 “ 忙 ”; 标志 寄存 器 EFLAGS 中 的 标志 
NT 置 1, 表 示 是 嵌 套 任务 。 

在 执行 中 断 返回 指令 IRETD 时 引起 任务 切换 ,那么 实施 解 链 。 要 求 目标 任务 是 “ 忙 ” 任 
务 。 在 切换 过 程 中 把 原 任 务 置 为 可用”, 目标 任务 仍 保持 “ 忙 ”。 

关于 中 断 或 异常 可 能 引起 任务 切换 的 具体 情况 ,以 及 指令 IRETD 可 能 引起 任务 切换 的 
具体 情形 ,将 在 9. 8 节 中 介绍 。 


9.7.6 任务 切换 的 演示 (示例 七 ) 


下 面 给 出 演示 任务 切换 的 示例 七 。 本 示例 的 逻辑 功能 是 ,在 完成 任务 切换 之 后 显示 原先 
任务 的 挂 起 点 的 偏 移 值 。 

1. 演示 内 容 和 执行 步 又 

为 了 简单 化 ,本 示例 没有 安排 中 断 描述 符 表 IDT, 不 允许 中 断 ,也 不 考虑 发 生 异 常 , 不 启用 
分 页 存储 管理 机 制 。 演 示 内 容 包 括 : 直接 通过 TSS 段 的 任务 切换 ; 通过 任务 门 的 任务 切换 ; 
任务 内 特权 级 的 变换 及 参数 传递 。 
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为 了 充分 演示 任务 的 切换 和 特权 级 的 变换 ,本 示例 在 保护 方式 下 涉及 到 两 个 任务 : 一 个 
任务 称 为 临时 任务 ; 另 一 个 任务 称 为 工作 任务 。 工 作 任 务 的 功能 是 演示 通过 调用 门 实现 特权 
级 的 变换 和 内 外 层 堆栈 之 间 参 数 的 自动 复制 。 临 时 任务 配合 工作 任务 一 起 演示 任务 切换 。 

演示 思路 是 : 从 实 方式 切换 到 保护 方式 时 进入 临时 任务 ; 然后 从 临时 任务 切换 到 工作 任 
务 ; 在 工作 任务 内 调用 子 程序 实现 本 示例 的 逻辑 功能 ,同时 演示 特权 级 的 变换 ; 随后 从 工作 
任务 又 切换 到 临时 任务 ; 最 后 在 临时 任务 切换 到 实 方式 。 

本 示例 的 主要 执行 步骤 如 图 9. 29 所 示 。 在 图 的 右边 标 出 了 任务 切换 和 特权 级 变换 的 分 
界 情况 。 在 从 临时 任务 切换 到 工作 任务 之 前 要 把 指向 临时 任务 TSS 描述 符 的 选择 子 装 入 
TR。 通 过 把 工作 任务 的 TSS 初始 化 成 恢复 点 在 特权 级 为 2 的 代码 段 ,使 得 在 从 临时 任务 切 
换 到 工作 任务 后 ,当前 特权 级 CPL 一 2。 
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图 9. 29 示例 七 的 主要 执行 步骤 
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2. 源 程序 组 织 和 清单 

除了 工作 程序 特征 信息 外 ,本 示例 依次 含有 以 下 组 成 部 分 。 

(1) 全 局 描述 符 表 GDT。 它 含有 工作 任务 TSS 描述 符 和 LDT 段 描述 符 , 还 含有 临时 任 
务 TSS 描述 符 和 临时 任务 的 代码 段 描述 符 。 此 外 ,还 含有 工作 子 程 序 代 码 段 描述 符 、 规 范 数 
据 段 描述 符 和 视频 存储 区 段 描 述 符 。 

(2) 工作 任务 的 TSS 段 。 按 照 工作 任务 的 功能 要 求 , 通 过 预 置 方式 进行 了 初始 化 ,好 像 
该 任务 曾经 运行 过 。 

(3) 工作 任务 的 LDT 段 。 它 含有 工作 任务 的 0 级 和 2 级 堆栈 段 描述 符 、 代 码 段 和 数据 段 
描述 符 、 分 别 以 数据 段 方式 描述 LDT 和 临时 任务 TSS 的 数据 段 描述 符 ,以 及 指示 工作 子 程序 
的 调用 门 和 指示 临时 任务 的 任务 门 。 

(4) 工作 任务 的 0 级 和 2 级 堆栈 段 。 它 们 都 是 32 位 段 ,特权 级 分 别 为 0 和 2。 

(5) 工作 任务 的 数据 段 。 它 属于 32 位 段 ,特权 级 3。 

(6) 工作 子 程序 代码 段 。 它 属于 32 位 代码 段 ,特权 级 0。 

(7) 工作 任务 的 代码 段 。 它 属于 32 位 代码 段 ,特权 级 2。 

(8) 临时 任务 的 TSS 段 。 未 初始 化 。 

(9) 临时 任务 的 代码 段 。 它 属于 16 位 段 ,特权 级 0。 

(10) 实 方式 下 的 数据 和 代码 段 。 





示例 七 的 源 程序 如 下 : 
;演示 任务 的 切换 ( 示例 七 , dq97) 
% include  "”DMCH" 文件 CH 含有 宏 的 声明 和 符号 常量 等 
section text ; 段 text 
bits 16 ;6 位 段 模 式 
Head: ;工作 程序 特征 信息 
HEADER end_of_text, Begin, 2000H 
GDTSeg: :工作 任务 的 全 局 描述 符 表 DT 
Dmy DESCRIPTIR 00000 ;三 描述 符 
Normal DESCRIPTOR FFFFHOOQATIW0 
Nomal_Sel eq Nomal- GDTSeg ;规范 段 描述 符 的 选择 子 
InitGDT: ;pT 中 待 初始 化 的 描述 符 


;工作 任务 TS 段 的 描述 符 ( DR=0) 及 其 选择 子 ( RRL= 0) 
DeroTsS DESCRIPTOR ”LerDTSS- 1, DTSSeg, 0. ATTSS32.0 

DISS Sel eq DerolSS- GTSeg ;Ma1 

;工作 任务 LIT 段 的 描述 符 ( bP= 0) 及 其 选择 子 ( RRL= 0) 

Dero DT DESCRIPTIOR LerDLDT- 1, DLDTSeg 0.ATLDT,O 

DDT Sel eq DerDT- GDTSeg 

; 池 程 序 代 码 段 描述 符 ( DR= 0) 及 其 选择 子 ( RR= 3) 

SubCode DESCRIPTOR © LenSCode- 1,SCodeSeg OATCE+ D320;  //@2 
SCode Sel3 equ (SubCode- GDTSeg) + RAL3 

滥 时 任务 的 任务 状态 段 描述 符 ( pn= 2) 及 其 选择 子 ( RRL= 0) 
TerpTSs DESCRIPTOR LenTTSS- 1, TTSSeg, 0. ATTSS32+ DPAL2.0 

TSS Sel eq Tarplss- DTSeg 

澳 时 代码 段 的 描述 符 ( DR= 0) 及 其 选择 子 ( RR= 0) 
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TerpCode DESCRIPTOR (FFFFH TCSeg 0 ATCE.O 
TOode Sel eq TampCode- OTSeg 

NunDesce eq ($-InitoOy /8 :pT 中 待 初始 化 的 描述 符 个 数 
;视频 存储 段 的 描述 符 ( DR= 3) 及 其 选择 子 ( RR= 0) 

Videden DESCRIPTOR OFFFFH 8000H CBH ATDW DPL3.0 

Wen Sel eq Videden GDTSeg 


alin 16 ;16 字 节 对 齐 
;工作 任务 的 状态 段 TS& 为 了 便于 预 置 方 式 初始 化 ,没有 采用 宏 ) 


DTSSeg: 
W 00 ;链接 字段 
DD Lenstack ;0 级 堆栈 指针 
DN Stad0 Sel, 0 初始 化 
mD 0 :1 级 堆栈 指针 ( 未 使 用 ) 
DW 00 ;未 初始 化 ( 未 使 用 ) 
DD LenStad2 ;2 级 堆栈 指针 
DN Stac2 Sel, 0 ;初始 化 
Dm 0 :CR3 
D DBegin ;EIP 工 作 任务 的 入口 点 Ma3 
mD 0 ;ELAGS 
DD 0 ;EAX 
DD 0 :EX 
m 0 ;EDX 
DD 0 ;EX 
DD LenStad2 ;ESP 工作 任务 的 堆栈 指针 
m 0 :EP 
mp 0 ;ESI 
D 8 :BK 显示 位 置 , 首 行 中 间 ) 
DN Wemn Sel, 0 ;视频 存储 段 
DW Doode Sel, 0 ;CS 工作 任务 的 代码 段 /@4 
DW Stad2 Sel, 0 ;SS 工作 任务 的 堆栈 段 选择 子 
DW DData Sel, 0 ;工作 任务 的 数据 段 
DN ADT sel,0 ;FS 别名 段 ( 对 应 临时 任务 DT) 
DW ATSS Sel, 0 ;G 别 名 段 ( 对 应 临时 任务 TSS) 
Do DDT Sel, 0 ;LDTR 工 作 任 务 的 UDT 段 
DW 0 
DN $+2-DISSeg ;指向 MO 许可 位 图 
DB Oo ;I0 许 可 位 图 结束 标志 
LenDTSS eq $-DTSseg 
alin 16 ;16 字 节 对 齐 


DDTSeg: :工作 任务 的 局 部 描述 符 表 LDT 
;工作 任务 的 0 级 堆栈 段 描述 符 ( DRL=0) 及 其 选择 子 ( RRL= 0) 

DemoStack0 & DESCRIPTOR LenStackO- 1, StackOSeg, OAIDWE D32.0 

Stack0 Sel equ (DemoStack0- DLDTSeg)+ TIL 

;工作 任务 的 2 级 堆栈 段 描述 符 ( DR=2) 及 其 选择 子 ( RRL= 2) 

DemoStack2 & DESCRIPTOR CLenStack2- 1, Stack2Seg, 0AIDW D32+ DPL2. 0 
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Stack?2 Sel ”equ ( DemoStack2- DLDTSeg)+ TIL+ RAL2 
;工作 任务 的 代码 段 描述 符 ( 匀 位 段 ,DP= 2) 及 其 选择 子 ( RR= 2) 
DerCode DESCRIPIOR LerDCode- 1,DCodeSeg 0 ATCE+ De2+ DPL20 ;//@5 

DCode Sel eq (DerCode-DiDTSeg)+TIL+RA2 ;//@6 

;工作 任务 的 数据 段 描述 符 ( 尼 位 段 ,DR= 3) 及 其 选择 子 ( RAL= 0) 
DemoData CDESCRIPTOR LerDData- 1,DDataSeg 0ATDW+ D32+ DPL3.0 

DData Sel eq (DemData- DLDTSeg)+ TIL 

:把 DT 别名 作为 普通 数据 段 的 描述 符 ( DH= 2) 及 其 选择 子 ( RRL= 0) 
ALDT DESCRIPTOR ”LerDLDT- 1,DLDTSeg 0 ATDW+ DPL2 0 

ADT Sel eq (ADT-DLDTSeg)+TIL 

;把 TepTSS 别名 作为 普通 数据 段 的 描述 符 ( DR=2) 及 其 选择 子 ( RRL= 0) 


ATTSS DESCRIPTOR LenTTSS- 1, TTSSeg, QAIDW DPL20 
ATTSS Sel eq (ATSS- DLDTSeg)+TIL 
NnDesd eq ($-DLDTSeg) /8 :LDT 中 待 初始 化 描述 符 个 数 


指向 子 程序 的 调用 门 (DR= 3) 及 其 描述 符 ( RRL= 2) 

PSubGate 。 GANIE SubBegin SCode Sel30ATIOGAT32+ DPL30 ;//@7 
PSGate Sel eq (PSbGate- DLDTSeg)+TILERR2 ;//@8 

;指向 临时 任务 TapTSS 的 任务 门 ( DR= 3) 及 其 选择 子 ( RR=0) 
PTTGate GATE QTTSS Sel,QATTASKGAT+ DR30 ;Ma9 
PTTGate Sel equ (PTTGate- DLDTSeg)+ TIL 





LerDLDT eq $-DLDTSeg ;DT 的 长 度 
alig 16 ;6 字 节 对 齐 

;工作 任务 的 0 级 堆栈 段 ( 了 ?位 段 ) 

Stack0Seg: 


Lerstad0 eq 512 
times LenStack0 DB 0 
;工作 任务 的 2 级 堆栈 段 ( 了 ?位 段 ) 


江 作 任务 的 数据 段 ( 2 位 段 ) 


DDataSeg: 
Message eq $- DDataSeg 
DB '"EIP= ,0 


:工作 任务 的 子 程序 段 ( 了 位 段 ) 


alin 16 :16 字 节 对 齐 
bits 22 ;了 2 位 段 模式 
SCodeSeg: 


SubBegin eq $- SCodeSeg 
SubR: 


在 显示 指定 的 字符 串 后 ,以 十 六 进 制 数 形式 显示 久 位 二 进 制 值 
;通过 堆栈 传递 参数 ( 第 1 个 是 要 显示 的 值 ,第 2 个 是 提示 信息 首 地 址 ) 
PUSH EBP 
WwW EEP 
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PUSHAD ;保护 现场 
;从 堆栈 (0 级 ) 中 取 提 示 信 息 串 的 起 始 地 址 偏 移 
MV ESI, [EEP+ 休 ;从 堆栈 取得 第 2 个 参数 
WW 用 证 ; 蓝 底 白字 
JWP SHORT .L2 
.L1:STOSN ;显示 提示 信息 
.L2:LODSB 
R 人 LA ;提示 信息 以 0 结尾 
J .U1 
;从 堆栈 (0 级 ) 中 取 显 示 值 
MY EX [EEP+ 16] ;从 堆栈 取得 第 1 个 参数 
WW EX 8 ; 乌 个 二 进 制 位 =8 个 十 六 进 制 位 
LRL EX 4 
WW AL DL 
CAL HIOASC ;转换 成 Asoll 码 
STOSW ;填写 到 视频 存储 区 ( 显示 ) 
LOP .13 
POPAD :恢复 现场 
POP EP 
REF 8 逆 间 返回 ,并 废除 堆栈 中 的 参数 MaeA 
HToASC: ;转换 成 对 应 ASCII 码 
AD A OH 
AD AL '0 
OP AL '9' 
JE SHRT .U1 
AD AL7 
Li:RET 段 内 返回 


:工作 任务 的 代码 段 ( 了 2 位 段 ,2 级 ) 


DCOodeSeg: 
align 16 ;16 字 节 对 齐 
bits 32 汉 位 段 模式 
or eax eax ;仅仅 占 位 , 装 装 样子 ,可 以 省 略 


DBegin eq $- DOodeSeg 
;把 要 复制 的 参数 个 数 置 入 调用 门 
MV BE [FS:PSubGate DOOUNF- DLDTSegl, 2  ;/@B 
;向 堆栈 ( 2 纲 中 压 入 参数 
PUSH ”DWORD “[GS:TerpTask TREIP- TerpTask] ;数据 ( 临时 任务 挂 起 上 /@C 
PUSH DWRD Message ;提示 信息 首 地 址 /@D 


CAL PsGate Sel:0 ;通过 调用 门 调用 工作 子 程序 /@E 
;把 指向 规范 数据 段 描述 符 的 选择 子 填 入 临时 任务 TSS 

RSH GS 

POP DS 

MV AX Nomal_Sel 

MY [TewTask TRDS- TTSSeg], MX 
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MV [TewTask TRES- TTSSesg] ， 
MN [TempTask TRFS- TTSSeg], 
MV [TewTask TRGS- TTSSeg], 
MV [TempTask TRSS- TTSSeg|, 


及 六 玉 到 


JP ”PTIGate Sel:0 ;通过 任务 门 切换 到 临时 任务 MaF 


痢 时 任务 的 任务 状态 段 TSS 
alin 16 ;6 字 节 对 齐 
TTSSeg: 
TerpTlask TASKSS 为 节省 篇 幅 ,采用 宏 


:临时 任务 的 临时 代码 段 ( 6 位 段 ,0 级 ) 


align 16 ;16 字 节 对 齐 
bits 16 ;6 位 段 模式 
TCOSeg: 
PM Entryl equ $-TOSeg 
WY AX TISS Sel 混 时 任务 TSS 
LR 以 ;装载 任务 寄存 器 从 Ma6 
JP ”DTSS_ sel:0 ;直接 切换 到 工作 任务 
PM_Entry2: ;准备 切换 回 实 方式 
or eax eax ;仅仅 占 位 , 装 装 样子 ,可 以 省 略 
Qs ; 清 任务 切换 标志 
MO EMX CRO ;准备 返回 实 方式 
AD MX CTFFEH 
MO CRO EX 
ToReal : ;真正 进入 实 方式 
JWP 0:Real 


align 16 


VGDTR PDESC LenbF 1,0 :00T 伪 描述 符 
VarESP m 0 浙 存 实 方式 的 堆栈 指针 


: 实 方式 的 代码 
bits 16 ;6 位 段 模式 
Begin: 
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WV [TRealt I, 以 到 定 位 

MV [VarESP], ESP ;保存 实 方式 下 堆栈 指针 

MV [Varss], SS 

WV SI，InitGDT 

MV CX, NnDescG 

CAL InitDescBA ;设置 GT 中 待 初 始 化 描述 符 的 基地 址 

MV Sl, DDTSeg 

MY CX, NnDescL 

CAL InitDescBA ;设置 UT 中 待 初 始 化 描述 符 的 基地 址 

WV SI，VGDTR 

MY BX GDTseg 

CAL InitPeDesc ;初始 化 用 于 0T 的 伪 描 述 符 

LOT [WDTR] ;装载 QTR 

Ql 

MV EAX C0 ;准备 切换 到 保护 方式 

RR EAX 1 

WY OR, EX 

JP Toode Sel:PM_ Entryi ;进入 保护 方式 下 的 临时 代码 段 
Real : ; 回 到 实 方式 

WW A Cs 

WW Ds 

LSS ESP, [VarESP] :恢复 实 方式 下 的 堆栈 指针 

STI ; 开 中 断 

FETF 返回 加 载 器 
% include =" PROC. ASM" ;包含 初始 化 阶段 的 相关 子 程序 
end_of_text: 源 代码 到 此 为 止 


3. 关于 示例 七 的 说 明 

下 面 主 要 就 任务 切换 的 方法 和 任务 内 特权 级 变换 时 堆栈 参数 的 复制 作 些 说 明 。 

(1) 从 临时 任务 直接 通过 TSS 切换 到 工作 任务 。 可 以 认为 ,在 从 实 方式 切换 到 保护 方式 
后 ,就 进入 了 临时 任务 。 但 任务 寄存 器 TR 还 没有 指向 临时 任务 的 任务 状态 段 TSS。 如 前 所 
述 ,在 从 临时 任务 切换 到 工作 任务 时 ,将 要 把 临时 任务 的 现场 保存 到 临时 任务 的 TSS, 这 要 求 
TR 指向 临时 任务 的 TSS。 为 此 , 先 利 用 LTR 指令 把 指示 临时 任务 TSS 描述 符 的 选择 子 装 入 
TR, 参 见 源 程序 “//@G” 行 。 利 用 LTR 指令 显 式 地 装载 TR ,不 是 真正 的 任务 切换 ,并 不 会 引 
用 TSS 的 内 容 。 这 也 解释 了 最 初 几乎 没有 初始 化 临时 任务 TSS 的 原因 。 

临时 任务 采用 如 下 段 间 转移 指令 JMP ,直接 通过 工作 任务 的 TSS ,切换 到 工作 任务 。 

JWP DISS Sel:0 

选择 子 DTSS_Sel 的 RPL 二 0, 指 示 如 下 工作 任务 的 TSS 描述 符 ,参见 源 程序 “//@1” 行 。 

DeroTSs DESCRIPTOR LerDTSS-1 DTSSeg 0 ATTSS32 0 

上 述 工 作 任务 TSS 的 描述 符 DPL 一 0。 在 执行 该 转移 指令 JMP 时 ,CPL 二 0, 符 合 CPL < 一 
DPL 和 RPL< 王 DPL 的 特权 级 要 求 , 并 且 它 是 一 个 “可 用 ”TSS, 所 以 顺利 进行 从 临时 任务 到 
工作 任务 的 切换 。 切 换 过 程 包括 : 把 临时 任务 的 执行 现场 保存 到 临时 任务 的 TSS 中 ; 从 工作 
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任务 的 TSS 中 恢复 工作 任务 的 现场 ; 把 工作 任务 的 LDT 描述 符 选 择 子 装载 到 LDTR 等 。 

从 源 程序 “//@4” 行 和 “//@3” 行 可 知 ,初始 化 后 的 工作 任务 TSS 中 CS 字段 存放 的 选择 
子 是 DCode_Sel, 对 应 的 描述 符 在 工作 任务 的 LDT 中 ,并 且 DPL 二 2, 它 描述 了 代码 段 
DemoCode, 同 时 挂 起 点 是 DemoBegin, 好 像 曾 经 执行 过 工作 任务 。 所 以 ,在 切换 到 工作 任务 
后 从 所 谓 的 挂 起 点 DCode_Sel: DemoBegin 开始 执行 ,并 且 CPL 一 2。 

由 于 使 用 JMP 指令 进行 任务 切换 ,因此 不 实施 任务 链接 。 

(2) 从 工作 任务 通过 任务 门 切换 到 临时 任务 。 工 作 任 务 采用 段 间 转移 指令 JMP, 通 过 任 
务 门 PTTGate 切换 到 临时 任务 ,参见 源 程序 *"//@F? 行 。 在 执行 切换 到 临时 任务 的 段 间 转移 
指令 JMP 时 ,CPL=2, 指 示 任 务 门 的 选择 子 PTTGate_Sel 的 RPL=0, 任 务 门 PTTGate 的 
DPL 王 3, 参 见 源 程序 *//@9” 行 ,符合 CPL < 二 DPL 和 RPL <==DPL 的 特权 级 要 求 , 所 以 可 以 
访问 该 任务 门 。 任 务 门 内 的 选择 子 TTSS_Sel 指示 临时 任务 TSS 描述 符 ,并且 此 时 的 临时 任 
务 TSS 是 “可 用 ?的 ,所 以 可 顺利 进行 任务 切换 。 工 作 任务 的 现场 保存 到 工作 任务 的 TSS; 临 
时 任务 的 现场 从 临时 任务 的 TSS 恢复 。 

临时 任务 的 挂 起 点 位 于 临时 任务 代码 段 内 的 PM_Entry2 处 ,所 以 恢复 后 的 临时 任务 从 该 
点 开始 ,CS 含 临 时 任务 代码 段 选择 子 。 但 由 于 在 工作 任务 内 “强硬 ”地 改变 了 临时 任务 TSS 
内 的 SS 和 DS 等 字段 ,因此 在 恢复 到 临时 任务 时 ,SS 和 DS 等 段 寄存 器 内 已 含 规范 数据 段 的 
选择 子 , 而 非 挂 起 时 的 原 有 值 。 注 意 , 这 种 做 法 不 被 提倡 ,但 在 这 里 却 充分 地 展示 如 何 从 TSS 
恢复 任务 。 

(3) 工作 任务 内 的 特权 级 变换 和 堆栈 参数 复制 。 在 工作 任务 内 ,采用 段 间 调用 指令 
CALL, 通 过 调用 门 PSubGate 调用 子 程序 SubR ,参见 源 程 序 “//@E” 行 。 执 行 段 间 调用 指令 
CALL 时 的 CPL 二 2, 指 令 所 含 指示 调用 门 的 选择 子 RPL 二 2, 调 用 门 的 DPL 二 3, 参 见 源 程序 
“//@8” 行 和 “//@7” 行 ,所 以 对 调用 门 的 访问 是 允许 的 。 由 于 调用 门 的 选择 子 SCode_Sel3 指 
示 的 子 程序 代码 段 描 述 符 SubCode 的 DPL==0, 参 见 源 程序 “//@2” 行 ,因此 在 调用 过 程 中 就 
发 生 了 从 特权 级 2 到 特权 级 0 的 变换 ,同时 堆栈 也 被 切换 。 

工作 任务 代码 在 调用 子 程序 SubR 之 前 .把 两 个 参数 压 入 了 堆栈 ,准备 传递 给 子 程序 , 参 
见 源 程序 “//@C” 行 和 “//@D” 行 。 在 把 参数 压 人 堆栈 时 ,CPL= 二 2, 使 用 的 也 是 对 应 特权 级 2 
的 堆栈 。 通 过 调用 门 进入 子 程序 后 ,CPL 二 0, 使 用 0 级 堆栈 。 为 此 ,把 调用 门 PSubGate 中 的 
Count 字段 设置 为 2, 表 示 在 特权 级 向 内 层 变换 时 , 需 从 外 层 堆 栈 依次 复制 两 个 双 字 参数 到 内 
层 堆 栈 。 随 着 特权 级 变换 ,堆栈 也 跟着 变换 ,如 图 9. 26 所 示 。 这 种 在 堆栈 切换 的 同时 复制 所 
需 参 数 的 做 法 ,保证 了 子 程序 方便 地 访问 堆栈 中 的 参数 ,而 无 需 考虑 是 哪个 堆栈 。 

随 着 从 子 程序 SubR 的 返回 ,CPL=0 变换 为 CPL 二 2, 堆 栈 也 回 到 2 级 堆栈 。 由 于 再 进入 
0 级 堆栈 时 ,总 是 从 空 栈 开 始 ,因此 在 返回 前 不 必 保 持 内 层 堆 栈 平衡 。 但 是 需要 废除 2 级 堆栈 
中 的 两 个 双 字 参数 。 从 源 程 序 “//@A” 行 可 知 ,这 是 采用 带 立即 数 的 段 间 返回 指令 实现 的 ,在 
返回 的 同时 自动 废除 外 层 堆栈 中 的 参数 。 这 种 处 理 方式 使 得 堆栈 切换 尽量 透明 ,而 不 影响 正 
常 的 使 用 。 

(4) 别名 技术 的 应 用 。 在 9.4. 3 对 示例 三 进行 说 明 时 ,已 介绍 过 别名 技术 。 本 示例 也 有 
两 处 应 用 了 别名 技术 。 

为 了 把 调用 门 PSubGate 中 的 Count 字段 设置 成 2, 参见 源 程序 “//@B” 使 用 一 个 数据 段 
描述 符 ALDT 描述 调用 门 所 在 的 工作 任务 LDT 段 ,该 描述 符 把 工作 任务 的 LDT 段 描述 成 数 
据 段 。 请 读者 考虑 本 示例 中 把 指示 该 数据 段 描述 符 的 选择 子 装载 到 FS 寄存 器 的 方法 。 
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另 一 处 是 把 临时 任务 的 TSS 视 作为 普通 数据 段 。 在 从 工作 任务 切换 到 临时 任务 之 前 ,把 
指向 描述 规范 数据 段 的 描述 符 Normal 的 选择 子 Normal_Sel 填 到 临时 任务 TSS 中 的 各 数据 
段 寄存 器 (包括 堆栈 段 寄存 器 ) 字 段 , 于 是 在 切换 到 临时 任务 时 ,作为 恢复 临时 任务 的 现场 ,该 
选择 子 就 被 装 到 DS 等 数据 段 寄 存 器 ,对 应 描述 符 Normal 内 的 信息 也 就 被 装 入 到 对 应 的 高 速 
缓冲 存储 器 中 ,为 从 临时 任务 切换 到 实 方式 做 准备 。 


9.8 中断 和 异常 的 处 理 


在 第 8 章 介绍 了 中 断 相 关 基 本 概念 ,说 明了 实 方式 下 响应 中 断 的 过 程 。 为 了 实现 保护 和 
支持 虚拟 化 ,IA-32 系列 CPU 增强 了 中 断 处 理 功 能 ,并 引入 “异常 "概念 。 本 节 介 绍 保护 方式 
下 中 断 和 异常 的 处 理 。 


9.8.1 异常 概念 


在 8.3 节 介 绍 了 中 断 相关 基本 概念 ,根据 引起 中 断 的 事件 来 源 , 把 中 断 分 为 外 部 中 断 和 内 
部 中 断 两 大 类 。 可 以 简单 地 认为 ,异常 是 指 内 部 中 断 。 

在 程序 运行 期 间 , 如 果 CPU 接收 到 来 自 外 部 设备 的 请 求 信号 ,将 引起 中 断 。 例 如 ,用 户 
获 击 键盘 ,将 引起 键盘 中 断 。 在 执行 一 条 指令 时 ,如 果 CPU 察觉 到 出 现 某 种 错误 条 件 , 将 导 
致 异常 。 例 如 ,执行 除数 为 0 的 除法 指令 ,将 导致 除法 出 错 异 常 。 又 如 ,访问 超出 数据 段 界限 
的 存储 单元 ,将 导致 通用 保护 异常 。 再 如 ,内 层 的 主 程序 调用 外 层 的 子 程序 ,也 将 导致 通用 保 
护 异 常 。 

异常 是 CPU 在 执行 指令 期 间 检 测 到 不 正常 的 或 非法 的 条 件 所 引起 的 。 异 常 与 正 执 行 的 
指令 有 直接 的 联系 。 与 此 不 同 , 中 断 却 往往 是 随机 的 。 

CPU 识别 多 种 不 同类 型 的 异常 ,并 赋予 每 一 种 类 型 不 同 的 (中 断 或 异常 ) 向 量 号 。 异 常 发 
生 后 ,CPU 就 像 响应 中 断 那 样 处 理 异常 ,也 即 根据 向 量 号 , 转 到 相应 的 中 断 处 理 程序 。 把 这 些 
中 断 处 理 程序 称 为 异常 处 理 程序 更 合适 。 

根据 引起 异常 的 程序 是 否 可 被 恢复 和 恢复 点 位 置 ,把 异常 进一步 分 类 为 故障 (Fault) 、 陷 
阱 CTrap) 和 中 止 (Abortb) 。 把 对 应 的 异常 处 理 程序 分 别称 为 故障 处 理 程 序 、 陷 阱 处 理 程序 和 
中 止 处 理 程序 。 

(1) 故障 是 指 在 引起 异常 的 指令 落实 之 前 ,把 异常 情况 通知 给 系统 的 一 种 异常 。 一 般 来 
说 ,故障 是 可 被 排除 的 。 当 控制 转移 到 故障 处 理 程序 时 ,所 保存 的 断 点 CS 及 EIP 通常 指向 引 
起 故障 的 指令 。 这 样 , 在 故障 处 理 程序 把 故障 排除 后 ,执行 指令 IRETD 返回 到 引起 故障 的 程 
序 继续 执行 时 ,刚才 引起 故障 的 指令 可 重新 得 到 执行 。 发 现 故障 的 时 刻 可 能 在 执行 指令 之 初 ， 
也 可 能 在 执行 指令 期 间 。 如 果 在 执行 指令 期 间 察觉 到 故障 ,那么 在 停止 执行 故障 指令 的 同时 ， 
可 能 把 指令 的 源 操作 数 恢 复 为 指令 开始 执行 之 前 的 值 。 这 可 保证 重新 执行 故障 指令 时 得 到 正 
确 的 结果 。 例 如 ,在 执行 某 条 指令 期 间 , 如 果 发 现 要 存 取 的 页 不 存在 ,那么 停止 执行 该 指令 ,并 
通知 系统 产生 页 故障 ,页 故障 处 理 程序 一 般 会 采取 把 对 应 页 内 容 装载 到 物理 内 存 的 方法 来 排 
除 故 障 ,在 这 之 后 原 指 令 就 可 成 功 执行 ,至 少 不 再 发 生 缺 页 引起 的 故障 。 

(2) 陷阱 是 指 在 引起 异常 的 指令 落实 之 后 ,把 异常 情况 通知 给 系统 的 一 种 异常 。 当 控制 
转移 到 异常 处 理 程序 时 ,所 保存 的 断 点 CS 及 EIP 指向 引起 陷阱 的 指令 的 下 一 条 要 执行 指令 。 
下 一 条 要 执行 的 指令 ,不 一 定 就 是 跟随 着 的 指令 。 因 此 ,陷阱 处 理 程序 并 不 是 总 能 根据 保存 的 
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断 点 , 反 推出 引起 异常 的 指令 。 在 转 入 陷阱 处 理 程序 时 ,引起 陷阱 的 指令 应 该 已 经 正常 完成 ， 
它 有 可 能 改变 了 寄存 器 或 存储 单元 。 软 中 断 指令 、 断 点 异常 是 陷阱 的 例子 。 

(3) 中 止 是 指 在 系统 出 现 严 重 情况 时 ,通知 系统 的 一 种 异常 。 引 起 中 止 的 指令 是 无 法 确 
定 的 。 产 生 中 止 后 原 执行 的 程序 不 能 被 恢复 执行 。 中 止 处 理 程序 往往 需要 重新 建立 各 种 系统 
表格 ,并 可 能 需要 重新 启动 操作 系统 。 硬 件 故 障 和 系统 表 中 出 现 非法 值 或 不 一 致 值 是 引起 中 
止 的 例子 。 


9.8.2 异常 类 型 

1. 识别 的 异常 

IA-32 系列 CPU 识别 的 异常 及 其 对 应 向 量 号 如 表 9.6 所 示 。 按 照 上 述 对 异常 的 分 类 ,在 
类 别 栏 进行 进一步 说 明 。 

利用 软 中 断 指令 “INT n”, 还 可 以 产生 向 量 号 为 n 的 陷阱 。 





表 9.6 异常 一 览 表 

向 量 号 异常 名 称 类 别 出 错 码 原因 说 明 
0 除法 出 错 故障 无 指令 DIV IDIV 
| 调试 异常 不 定 无 调试 ,由 DR6 等 决定 是 故障 或 陷阱 
2 一 = 用 于 不 可 屏蔽 中 断 
3 单字 节 INT3 陷阱 无 指令 INT 3 
4 溢出 陷阱 无 指令 INTO 
5 边界 检查 故障 无 指令 BOUND 
6 无 效 操作 码 故障 无 无 效 指令 编码 或 操作 数 
本 设备 不 可 用 故障 无 浮 点 或 WAIT 指令 
8 双重 故障 中 止 有 0 任何 能 导致 异常 的 指令 NMI、INTR 
9 协 处 理 器 段 越界 故障 无 访问 存储 器 的 浮 点 指令 
0A 无 效 TSS 故障 有 任务 切换 或 TSS 访问 
0B 段 不 存在 故障 有 装载 段 寄 存 器 ,或 访问 系统 段 
0C 堆栈 段 故 障 故障 有 堆栈 操作 ,或 装载 SS 
0D 通用 保护 故障 有 任何 存储 器 引用 ,或 特权 级 检测 
OE 页 故障 故障 有 任何 存储 器 引用 
10 协 处 理 器 出 错 故障 无 浮 点 或 WAIT 指令 
11 对 齐 检测 故障 有 0 任何 存储 器 数据 引用 
缀 机 器 检测 中 止 无 与 CPU 有 关 
13 SIMD 浮 点 异常 故障 无 SSE/SSE2/SSE3 浮 点 指令 

14 一 1F 保留 


从 表 9.6 可 知 ,部 分 异常 的 向 量 号 (如 08 一 OFH) 与 8. 3 节 介 绍 的 外 部 中 断 的 向 量 号 冲 
突 。 一 方面 ,在 推出 IA-32 系列 CPU 时 ,Intel 宣布 保留 前 32 个 向 量 号 (00 一 1FH); 另 一 方 
面 ,可 以 通过 设置 中 断 控制 器 ,调整 8. 3 节 介 绍 的 外 部 中 断 的 向 量 号 。 事 实 上 ,如果 操 作 系 统 
支持 保护 方式 ,那么 会 给 外 部 中 断 另 行 分 配 中 断 向 量 号 ,从 而 避免 冲突 。 

从 表 9.6 可 知 , 对 某 些 异常 CPU 还 以 出 错 码 的 方式 提供 一 些 附加 信息 ,以 便 异 常 处 理 程 
序 进一步 判断 异常 原因 ,做 出 合适 的 处 理 。 出 错 码 栏 的 “无 ”表示 不 提供 出 错 码 ,“ 有 ”表示 提供 
出 错 码 。 
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2. 出 错 码 格式 
大 部 分 出 错 码 的 格式 如 图 9. 30 所 示 。 从 图 中 可 知 , 出 错 码 类 似 于 段 选择 子 , 但 是 最 低 的 
3 位 被 重新 定义 。 


31 15 3 2 工 0 





保留 段 选择 子 的 索引 |TI lIDTIEXT| 























9.30 异常 出 错 码 格式 


EXT 标记 为 1, 表 示 由 外 部 事件 (External Event) 引 发 异常 ,可 以 理解 为 响应 外 部 中 断 的 
过 程 中 出 现 异常 。IDT 标记 为 1, 表 示 错 误 码 的 “ 段 选 择 子 的 索引 ”指示 中 断 描述 符 表 IDT 中 
的 门 描述 符 ; 否则 指示 GDT 或 LDT 中 的 描述 符 。 仅 当 IDT 标记 为 0 时 ,TI 标记 才 有 效 ,这 
时 TI 标记 为 1 表示 错误 码 中 的 索引 指示 LDT 中 的 描述 符 。 

在 某 些 情形 下 ,错误 码 可 能 为 0。 这 表示 异常 与 装载 存储 段 无 关 , 或 者 涉及 到 装载 空 选择 
子 的 段 。 出 错 码 被 压 入 堆栈 ,在 下 一 节 会 进一步 说 明 。 为 了 保证 堆栈 操作 的 双 字 对 齐 ,出错 码 
的 高 位 部 分 被 保留 。 

3. 常见 故障 说 明 

(1) 除法 出 错 故障 (异常 0) 。 除 法 出 错 异 常 是 故障 。 当 执行 无 符号 除 指令 DIV 或 有 符号 
除 指 令 IDIV 时 ,如 果 察 觉 到 除数 等 于 0, 或 者 商 太 大 ,引起 这 一 故障 。 发 生 除 法 出 错 故 障 时 ， 
不 提供 出 错 码 。 进 入 除法 出 错 故障 处 理 程序 时 ,保存 的 CS 及 EIP 指向 引起 除法 出 错 故障 的 
指令 。 

(2) 无 效 操作 码 故 障 (异常 6) 。 当 察觉 到 以 下 情形 时 ,引起 无 效 操作 码 故障 : 试图 执行 操 
作 码 部 分 无 效 的 指令 ; 要 求 使 用 存储 器 操作 数 的 场合 ,使 用 了 寄存 器 操作 数 ; 不 能 被 加 锁 的 
指令 使 用 了 LOCK 前 级 。 发 生 无 效 操作 码 故 障 时 ,不 提供 出 错 码 。 进 入 无 效 操作 码 故 障 处 理 
程序 时 ,保存 的 CS 及 EIP 指向 引起 无 效 操作 码 故 障 的 指令 。 

(3) 无 效 TSS 故障 (异常 0AH)。 在 任务 切换 期 间 , 或 者 在 执行 需要 用 到 TSS 内 信息 的 
指令 期 间 , 当 察觉 与 TSS 相关 的 某 个 错误 条 件 , 就 引起 无 效 TSS 故障 。 如 果 在 任务 切换 实施 
之 前 ,发 现 错误 条 件 , 在 进入 故障 处 理 程序 时 ,保存 的 CS 及 EIP 指向 引发 任务 切换 的 指令 。 
如 果 在 任务 切换 实施 之 后 ,在 进入 故障 处 理 程序 时 ,保存 的 CS 及 EIP 指向 新 任务 的 第 一 条 
指令 。 

发 生 无 效 TSS 故障 时 ,提供 出 错 码 ,其 格式 如 图 9. 30 所 示 。 出 错 码 的 索引 部 分 与 导致 故 
障 的 具体 错误 条 件 有 关 。 

在 任务 切换 期 间 ,一 些 导 致 无 效 TSS 故障 的 错误 条 件 有 : 如 果 用 于 装载 CS 的 代码 段 选 
择 子 是 空 选择 子 , 或 者 如 果 代 码 段 选择 子 索 引 超出 描述 符 表 的 界限 ,那么 错误 码 含 有 代码 段 选 
择 子 的 索引 ; 如 果 用 于 装载 DS 等 数据 段 寄存 器 的 选择 子 没有 指示 数据 段 描述 符 或 者 可 读 的 
代码 段 描述 符 ,那么 错误 码 含有 数据 段 选 择 子 的 索引 ; 如 果 用 于 装载 SS 的 选择 子 指示 非 数据 
段 描述 符 ,或 者 指示 不 可 写 的 数据 段 ,那么 错误 码 含 有 堆栈 段 选择 子 的 索引 ;， 如 果 用 于 装载 
LDTR 的 选择 子 指示 无 效 的 LDT 描述 符 ,那么 错误 码 含 有 LDT 段 选择 子 的 索引 ; 如 果 32 位 
TSS 的 段 界 限 小 于 103 字 节 ,那么 错误 码 含 有 TSS 段 选择 子 的 索引 。 还 有 其 他 许多 错误 条 
件 ,不 一 一 列举 。 

(4) 段 不 存在 故障 (异常 0BH) 。 在 加 载 段 寄存 器 CS`DS、ES、FS 或 GS 时 ,如 果 发 现 对 应 
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选择 子 指示 的 描述 符 的 P 位 为 0( 表 示 对 应 段 不 存在 ) ,那么 就 引起 段 不 存在 故障 。 还 有 下 列 
情形 也 可 能 引起 段 不 存在 故障 : 利用 LLDT 指令 装载 局 部 描述 符 表 寄 存 器 LDTR; 利用 LTR 
指令 装载 任务 寄存 器 TR; 使 用 其 他 部 分 有 效 , 但 P 位 为 0 的 门 描述 符 或 TSS 描述 符 。 在 进 
入 故障 处 理 程序 时 ,保存 的 CS 及 EIP 通常 指向 发 生 故 障 的 指令 。 如 果 在 任务 切换 期 间 发 生 
段 不 存在 故障 ,也 即 按 来 自 TSS 的 选择 子 装载 上 述 段 寄存 器 时 ,发 现 段 不 存在 ,进入 故障 处 理 
程序 时 ,保存 的 CS 及 EIP 指向 新 任务 的 第 一 条 指令 。 

发 生 段 不 存在 故障 时 ,提供 如 图 9. 30 所 示 的 出 错 码 , 它 包 含 引起 故障 的 段 选择 子 索引 。 

(5) 堆栈 段 故障 (异常 0CH)。 在 涉及 堆栈 操作 或 者 加 载 堆栈 段 寄存 器 SS 时 ,如 果 察 觉 
某 个 错误 条 件 , 引 起 堆栈 段 故 障 。 在 进入 堆栈 段 故障 处 理 程序 时 ,保存 的 CS 及 EIP 一 般 总 是 
指向 发 生 故 障 的 指令 ; 但 是 如 果 故 障 出 现在 任务 切换 期 间 ,保存 的 CS 及 EIP 可 能 指向 新 任务 
的 第 一 条 指令 。 发 生 堆 栈 故 障 时 ,提供 如 图 9. 30 所 示 的 出 错 码 。 

在 普通 堆栈 操作 时 ,如 果 有 效 地 址 超出 段 界 限 所 规定 的 范围 ,引起 堆栈 段 故障 。 这 种 情况 
下 的 出 错 码 是 0。 例 如 ,PUSH 或 者 POP 操作 时 ,超出 堆栈 的 范围 。 又 如 ,以 EBP 作为 基 址 
寄存 器 访问 堆栈 时 ,有 效 地 址 超出 堆栈 段 界限 。 

在 加 载 堆 栈 段 寄存 器 SS 时 ,如 果 对 应 选择 子 指示 的 描述 符 的 P 位 为 0( 表 示 对 应 段 不 存 
在 ), 引 起 堆栈 段 故 障 。 这 种 情形 下 的 出 错 码 包含 对 应 的 选择 子 。 注 意 , 上 述 段 不 存在 故障 不 
包括 这 种 堆栈 段 不 存在 的 情形 。 利 用 MOV 指令 或 者 LSS 指令 可 以 加 载 SS, 另 外 ,任务 切换 
期 间 , 或 者 配合 特权 级 切换 的 堆栈 切换 ,都 会 加 载 SS。 

(6) 通用 保护 故障 (异常 0DH)。 除 了 明确 列 出 的 保护 故障 外 ,其 他 违反 保护 规则 的 异常 
都 被 视 为 通用 保护 故障 。 在 进入 通用 故障 处 理 程序 时 ,保存 的 CS 及 EIP 指向 引发 故障 的 指 
令 。 发 生 通用 保护 故障 时 ,提供 如 图 9. 30 所 示 的 出 错 码 。 

在 执行 指令 时 ,如 果 察 觉 到 以 下 违反 保护 规则 的 错误 条 件 ( 仅 举例 列 出 了 部 分 ) ,将 引起 通 
用 保护 故障 。 

Q@ 向 某 个 代码 段 或 只 读 的 数据 段 写 人 ; 或 者 从 某 个 只 能 执行 的 代码 段 读 出 ; 或 者 在 通过 
段 寄存 器 CS.DS、ES、FS 或 GS 访问 内 存 时 , 偏 移 越 出 段 界限 ; 或 者 在 通过 段 寄 存 器 DS、ES、 
FS 或 GS 访问 内 存 时 , 段 寄存 器 含有 空 选择 子 。 这 时 ,提供 的 出 错 码 是 0。 

@ 把 指向 只 能 执行 的 代码 段 的 选择 子 装载 到 段 寄 存 器 DS`ES、FS 或 GS; 或 者 把 指向 系 
统 段 的 选择 子 装载 到 段 寄存 器 SS.DS、ES、FS 或 GS; 或 者 将 控制 转移 到 一 个 不 可 执行 的 段 。 
这 时 ,提供 的 出 错 码 含有 对 应 选择 子 的 索引 。 

@ 在 利用 LLDT 指令 装载 局 部 描述 符 表 寄 存 器 LDTR 时 ,选择 子 并 非 指示 LDT 段 描述 
符 , 或 并 非 指示 GDT 中 的 描述 符 ( 空 描述 符 除外 ); 或 者 在 利用 LTR 指令 装载 任务 寄存 器 
TR 时 ,选择 子 并 非 指 示 TSS 描述 符 , 或 者 并 非 指 示 GDT 中 的 描述 符 。 这 时 ,提供 的 出 错 码 
含有 对 应 选择 子 的 索引 。 

@ 把 PG 位 为 1 但 PE 位 为 0 的 控制 信息 装 和 人 到 控制 寄存 器 CR0; 或 者 在 CPL > 0 的 情 
况 下 执行 特权 指令 。 这 时 ,提供 的 出 错 码 是 0。 

从 上 述 各 种 情形 可 知 , 许 多 通用 保护 故障 是 由 程序 自身 错误 引起 的 ,无 法 被 排除 ,这 时 只 
能 终止 程序 ; 还 有 一 些 通 用 保护 故障 是 为 了 支持 虚拟 化 而 有 意 安排 的 ,通过 模拟 的 方法 ,可 以 
排除 这 种 有 意 安排 的 故障 。 

(7) 页 故障 (异常 0OEH)。 在 启用 分 页 存储 管理 机 制 后 ,在 把 线性 地 址 转换 为 物理 地 址 的 
过 程 中 ,如 果 发 现 以 下 错误 条 件 , 将 引起 页 故障 。 对 应 页 目录 项 或 页 表 项 中 的 P 位 为 0, 也 即 
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没有 对 应 的 物理 页 ; 或 者 只 有 用 户 特权 级 , 却 要 存 取 系统 页 ; 或 者 只 有 用 户 特权 级 , 却 要 写 只 
读 页 ; 或 者 在 控制 寄存 器 CRO 中 的 WP 位 置 为 1 情况 下 ,系统 特权 级 的 代码 还 要 写 只 读 的 用 
户 页 ; 或 者 页 目录 项 中 的 保留 位 设置 1。 

在 发 生 页 故障 时 ,提供 出 错 码 。 出 错 代码 的 格式 如 图 9. 31 所 示 。 其 中 ,P 标记 反映 是 否 
缺 页 ;， W/R 标记 反映 读 写 操作 ; U/S 标记 反映 用 户 级 还 是 系统 级 存 取 ; 当 控 制 寄 存 器 CR4 
中 的 PSE 位 或 PAE 位 被 置 时 ,RSVD 标记 反映 页 目录 项 中 的 保留 位 是 否 被 设置 。 


31 4 3 


ew U/S IR/W| 


在 发 生 页 故障 时 ,控制 寄存 器 CR2 含有 引起 页 故障 的 线性 地 址 。 

在 进入 页 故障 处 理 程序 时 ,保存 的 CS 及 EIP 通常 指向 引起 页 故障 的 指令 。 如 果 在 任务 
切换 期 间 发 生 页 故障 ,那么 可 能 指向 新 任务 的 第 一 条 指令 。 

通过 分 析出 错 码 , 页 故障 处 理 程序 不 仅 能 够 判断 故障 原因 ,而 且 通常 能 够 排除 故障 。 也 即 
按照 CR2 所 含 线性 地 址 ,确定 对 应 的 页 ,并 分 配 物理 内 存 , 装 入 对 应 的 页 。 换 句 话 说 ,就 是 实 
现 虚 拟 存储 器 。 但 是 ,可 能 无 法 排除 那些 并 非 有 意 违反 特权 规则 的 故障 。 例 如 , 因 程 序 自 身 引 
用 不 正确 指针 去 访问 存储 单元 ,这 样 的 故障 无 法 被 排除 ,只 能 终止 这 样 的 程序 。 


9.8.3 ”中断 和 异常 的 处 理 


在 8. 3 节 介 绍 了 实 方式 下 中 断 和 异常 的 处 理 。 下 面 介 绍 保护 方式 下 中 断 和 异常 的 处 理 。 

1. 中 断 描 述 符 表 IDT 

在 保护 方式 下 ,IA-32 系列 CPU 在 响应 中 断 或 者 处 理 异常 时 ,从 中 断 描述 符 表 (Interrupt 
Descriptor Table,IDT) 获 得 对 应 处 理 程序 的 入 口 信息 。CPU 把 中 断 ( 异 常 ) 向 量 号 作为 指示 
中 断 描述 符 表 IDT 内 门 描述 符 的 索引 。 在 实 方式 下 ,中 断 向 量 号 则 是 指向 中 断 向 量 表 内 中 断 
向 量 的 索引 。 

整个 系统 只 有 一 张 中 断 描述 符 表 IDT, 这 与 全 局 描述 符 表 GDT 类 似 。 中 断 描述 符 表 寄 
存 器 IDTR 给 定 IDT 表 在 内 存 中 的 具体 位 置 , 这 与 图 9. 10 所 示 的 GDTR 寄存 器 给 定 GDT 表 
相似 。 由 于 CPU 只 识别 256 个 中 断 ( 异 常 ) 向 量 号 ,因此 IDT 表 最 大 长 度 是 2KB。 

中 断 描述 符 表 IDT 所 含 的 描述 符 只 能 是 中 断 门 、 陷 阱 门 或 任务 门 。 也 就 是 说 ,在 保护 方 
式 下 ,CPU 只 有 通过 中 断 门 .陷阱 门 或 任务 门 才能 转移 到 对 应 的 中 断 或 异常 处 理 程序 。 

图 9. 23 给 出 了 门 描述 符 的 格式 ,从 图 中 可 知 , 门 描述 符 包含 由 选择 子 和 偏 移 构 成 的 48 位 
全 指针 。 另 外 , 双 字 计数 字段 对 中 断 门 .陷阱 门 和 任务 门 而 言 无 意义 。 

2. 中 断 响应 和 异常 处 理 的 前 导 步 又 

在 响应 中 断 或 处 理 异常 的 过 程 中 ,转移 到 中 断 或 异常 处 理 程序 的 方式 方法 ,与 由 段 间 调用 
指令 CALL 转移 到 子 程序 相似 。 中 断 响 应 或 异常 处 理 的 前 导 步 又 如 下 。 

(1) 判断 中 断 (异常 ) 向 量 号 指示 的 描述 符 是 否 超 出 中 断 描述 符 表 IDT 的 界限 。 如 果 超 出 
界限 ,将 引起 通用 保护 故障 。 出 错 码 含有 向 量 号 ,并 且 IDT 标记 为 1, 也 即 向 量 号 乘 上 8 再 加 
2。 出 错 码 中 EXT 标记 也 可 能 为 1。 
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图 9.31 页 故障 错误 代码 的 格式 
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(2) 根据 向 量 号 从 IDT 表 中 获得 门 描述 符 的 内 容 , 检 测 门 描述 符 类 型 。 门 描述 符 只 能 是 
中 断 门 .陷阱 门 或 任务 门 , 否 则 引起 通用 保护 故障 ,出 错 码 同 上 。 对 于 由 执行 指令 INT 或 指令 
INTO 所 致 的 响应 处 理 , 还 要 检测 门 描述 符 DPL, 要 求 CPL < 二 DPL ,否则 引起 通用 保护 故障 ， 
出 错 码 同上 。 这 种 检测 可 以 防止 应 用 程序 执行 软 中 断 指令 INT 时 ,滥用 分 配给 外 部 设备 使 用 
的 中 断 向 量 号 。 当 然 , 门 描述 符 中 的 P 位 必须 是 1, 表 示 门 描述 符 是 一 个 有 效 项 ,否则 引起 段 
不 存在 故障 ,出 错 码 同上 。 

(3) 根据 门 描述 符 类 型 ,分 情况 进 后 续 步 又 :; 通过 中 断 门 或 陷阱 门 到 达 中 断 或 异常 处 理 
程序 ; 根据 任务 门 切换 到 以 独立 任务 形式 存在 的 处 理 程序 。 

对 于 异常 处 理 , 在 开始 上 述 步 又 之 前 ,还 要 根据 异常 类 型 确定 返回 点 ; 如 果 提 供出 错 码 ， 
则 形成 符合 出 错 码 格式 的 出 错 码 。 

3. 通过 中 断 门 或 陷阱 门 的 转移 

如 果 中 断 (异常 ) 向 量 号 所 指示 的 门 描述 符 是 中 断 门 或 陷阱 门 ,那么 控制 转移 到 当前 任务 
的 一 个 处 理 程序 ,并 且 可 以 变换 特权 级 。 这 时 转移 的 方式 方法 ,与 段 间 调用 指令 CALL 经 过 
调用 门 转移 到 子 程序 代码 段 相 似 。 中 断 门 或 陷阱 门 含有 指向 中 断 或 异常 处 理 程序 的 48 位 全 
指针 。 其 中 ,16 位 选择 子 是 对 应 处 理 程序 代码 段 的 选择 子 , 它 指示 GDT 表 或 LDT 表 中 的 描 
述 符 ; 32 位 偏 移 指示 处 理 程序 人 口 点 在 代码 段 内 的 偏 移 。 图 9. 32 给 出 了 经 过 中 断 门 或 陷阱 
门 进 入 处 理 程序 的 示意 图 。 
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图 9.32 经 过 中 断 门 或 陷阱 门 进入 处 理 程序 的 示意 图 


通过 中 断 门 或 陷阱 门 转移 的 大 致 流程 如 图 9. 33 所 示 ,假设 是 32 位 中 断 门 或 陷阱 门 。 该 
流程 由 硬件 自动 进行 。 图 9. 33 中 “开始 "是 上 述 前 导 步 又 之 后 的 分 情况 进行 后 续 步 骤 的 起 点 。 
此 时 ,已 对 由 向 量 号 所 指示 的 IDT 表 中 的 中 断 门 或 陷阱 门 描述 符 进 行 过 必要 的 检测 ,并 从 中 
取得 指向 中 断 或 异常 处 理 程序 的 由 选择 子 和 偏 移 构成 的 48 位 全 指针 。 该 流程 以 转移 到 中 断 
或 异常 处 理 程序 结束 ,或 者 以 引发 通用 保护 故障 或 者 无 效 TSS 故障 结束 。 
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EFLAGS 压 入 堆栈 
了 
CS 压 入 堆栈 
N 碟 硒 段 描述 符 ; EP 压 入 坟 栈 
DPL<=CPL? 
了 
装载 CS 和 EIP 
非 一 致 代码 段 ， N 
且 DPL<CPL? 天 
S 提供 错误 码 ? 
1 Y 
准备 切换 到 内 层 维 栈 1 
出 错 码 压 入 堆栈 
中 断 门 ? 
Y 
= 
使 CPL=DPL 使 标志 IF-0 





入 口 偏 移 越界 ? 使 标志 TF=0,NT=0 


下 
通用 保护 故障 转 入 处 理 程序 


图 9.33 通过 中 断 门 或 陷阱 门 转移 的 流程 


























下 面 结合 图 9. 33 对 转移 过 程 进行 说 明 。 
中 断 门 或 陷阱 门 内 指示 中 断 或 异常 处 理 程序 的 段 选择 子 必须 指示 一 个 代码 段 描 述 符 。 如 


昌 


果 段 选择 子 为 空 ,那么 引起 通用 保护 故障 ,出 错 码 是 0。 如果 段 选 择 子 指示 的 描述 符 超出 对 应 
描述 符 表 的 界限 ; 或 者 指示 的 描述 符 不 是 代码 段 描述 符 ; 或 者 代码 段 描述 符 特 权 级 DPL > 


CPL, 那 么 引起 通用 保护 故障 ,出 错 码 含 选 择 子 的 索引 。 如 果 指 示 的 描述 符 无 效 (P 位 为 0) ,天 
么 引起 段 不 存在 故障 ,错误 码 含 选择 子 。 


E 


中 断 或 异常 可 以 转移 到 相同 特权 级 或 者 内 层 特权 级 。 如 果 处 理 程序 属于 一 致 代码 段 ,或 


者 代码 段 描 述 符 DPL 一 CPL, 那 么 只 是 相同 特权 级 的 转移 ,比较 简单 。 如 果 处 理 程序 属于 玫 


E 


一 致 代码 段 ,并 且 代 码 段 描述 符 DPL < CPL ,那么 要 发 生 特权 级 的 变换 ,堆栈 也 要 切换 成 内 层 
堆栈 。 实 施 堆栈 切换 比较 复杂 ,要 做 一 系列 准备 工作 ,如 果 不 能 成 功 切换 到 内 层 堆栈 ,将 引起 


无 效 TSS 故障 ,实际 上 为 了 切换 堆栈 ,需要 从 当前 任务 的 TSS 中 获取 内 层 堆栈 的 指针 。 由 于 





毕 竞 不 是 调用 子 程序 ,因此 不 复制 堆栈 中 的 参数 。 在 成 功 切换 堆栈 后 ,将 提升 特权 级 ,也 即 以 


代码 段 描述 符 DPL 作为 CPL。 
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为 了 顺利 地 转移 到 中 断 或 异常 处 理 程序 ,还 会 检测 处 理 程序 人 口 点 的 偏 移 是 否 越界 , 即 是 
否 超出 代码 段 界限 。 如 果 越 界 , 将 引起 出 错 码 为 0 的 通用 保护 故障 。 

从 图 9. 33 可 知 ,把 标志 寄存 器 和 中 断 点 (返回 地 址 ) 压 入 堆栈 的 做 法 和 顺序 与 实 方式 下 相 
同 , 但 这 里 每 一 次 堆栈 操作 是 一 个 双 字 ,CS 被 扩展 成 32 位 。 

把 标志 寄存 器 中 的 标志 位 TF 置 成 0, 表示 不 允许 处 理 程序 单 步 执行 。 把 标志 位 NT 置 成 
0, 表 示 处 理 程序 在 利用 中 断 返 回 指令 IRETD 返回 时 ,返回 到 同一 任务 而 不 是 一 个 赔 套 任务 。 

从 图 9. 33 可 知 ,通过 中 断 门 的 转移 和 通过 陷阱 门 的 转移 之 间 的 差别 只 是 对 IF 标志 的 处 
理 不 同 。 对 于 中 断 门 ,在 转移 过 程 中 ,把 标志 IF 置 为 0, 使 得 在 处 理 程序 执行 期 间 , 屏 项 掉 
INTR 中 断 ; 对 于 陷阱 门 , 在 转移 过 程 中 ,保持 标志 IF 不 变 , 即 如 果 标 志 IF 原 是 1 ,那么 通过 
陷阱 门 转移 到 处 理 程序 之 后 仍 允 许 INTR 中 断 。 因 此 ,中 断 门 适宜 于 处 理 中 断 ,而 陷阱 门 适宜 
于 处 理 异 常 。 

从 图 9. 33 可 知 ,在 提供 出 错 码 的 情况 下 ,在 转 入 异常 处 理 程 序 之 前 ,还 把 出 错 码 压 人 堆 
栈 。 只 有 异常 才 可 能 提供 出 错 码 。 

图 9. 34 给 出 了 通过 中 断 门 或 陷阱 门 转移 时 的 堆栈 情况 。 图 9. 34(a) 是 相同 特权 级 和 没 
有 出 错 码 的 情形 ; 图 9. 34(b) 是 相同 换 特权 级 和 有 出 错 码 的 情形 ; 图 9. 34(c) 是 变换 特权 级 和 
没有 出 错 码 的 内 层 堆栈 情形 ; 图 9. 34(d) 是 变换 特权 级 和 有 出 错 码 的 内 层 堆栈 情形 。 注 意 ,图 
中 每 一 项 为 双 字 。 






























































外 层 SS 外 层 SS 
外 层 ESP 外 层 ESP 
EFLAGS EFLAGS EFLAGS EFLAGS 

CS CS 外 层 CS 

EIP 返回 前 ESP EIP 外 层 EIP 返回 前 ESP| ”外 层 EIP 

i 而 铺 厅 “| 看 铺 本 

ESP - ESP 一 
0 0 0 
(a) (b) (c) (d) 


9.34 通过 中 断 门 或 陷阱 门 转移 时 的 堆栈 


4. 通过 任务 门 的 转移 

如 果 中 断 ( 异 常 ) 向 量 号 所 指示 的 门 描述 符 是 任务 门 描述 符 ,那么 控制 转移 到 一 个 以 独立 
任务 方式 出 现 的 处 理 程序 。 任 务 门 中 含 48 位 全 指针 。 这 时 ,任务 门 内 16 位 选择 子 指向 对 应 
处 理 程序 任务 的 TSS 段 。 这 种 通过 任务 门 转移 的 方式 方法 ,与 段 间 调用 指令 CALL 经 过 任务 
门 转移 相似 。 它 们 的 主要 区 别 是 ,对 于 提供 出 错 码 的 异常 ,在 完成 任务 切换 之 后 ,把 出 错 码 压 
入 新 任务 的 堆栈 中 。 

通过 任务 门 的 转移 ,在 进入 中 断 或 异常 处 理 程序 时 ,标志 寄存 器 EFLAGS 中 的 标志 位 
NT 置 1, 表 示 是 嵌 套 任务 。 

在 响应 中 断 或 处 理 异 常 时 ,使 用 任务 门 可 提供 一 个 处 理 程 序 任 务 的 自动 调度 。 这 种 任务 
调度 由 硬件 直接 执行 .并且 越过 包含 在 操作 系统 中 的 软件 任务 切换 ,这 种 方法 能 够 为 处 理 程序 
提供 一 个 简便 的 任务 切换 。 
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5. 转移 方法 的 比较 

对 中 断 的 响应 和 异常 的 处 理 ,CPU 允许 通过 使 用 中 断 门 或 陷阱 门 转交 给 当前 任务 内 部 的 
一 个 过 程 (程序 ) 进 行 具体 处 理 ; 也 允许 通过 使 用 任务 门 转交 给 另外 一 个 任务 进行 具体 处 理 。 
在 当前 任务 内 的 处 理 程序 较为 简单 ,并 可 以 很 快 转移 到 处 理 程序 ,但 是 处 理 程序 要 负责 保存 及 
恢复 CPU 的 寄存 器 等 现场 内 容 。 转 到 不 同 任务 的 处 理 程 序 要 花费 较 长 时 间 , 保 存 及 恢复 
CPU 寄存 器 等 现场 内 容 的 开销 作为 任务 切换 的 一 部 分 。 使 用 当前 任务 内 的 处 理 程序 的 方法 ， 
在 响应 中 断 或 处 理 异 常 时 ,对 正 执行 任务 的 状态 可 直接 进行 访问 ,但 是 ,这 样 就 要 求 每 一 个 任 
务 之 内 都 包含 一 个 处 理 程 序 。 使 用 独立 任务 的 处 理 方法 ,使 处 理 程序 得 到 较 好 的 隔离 ,但 在 响 
应 中 断 或 处 理 异 常 时 ,对 原 任务 状态 的 访问 变 得 较为 复杂 。 

处 理 无 效 TSS 故障 的 程序 必须 采用 任务 门 的 途径 ,以 保证 无 效 TSS 故障 处 理 程序 有 一 
个 有 效 的 任务 环境 。 处理 其 他 异常 的 程序 通常 被 安排 在 任务 环境 之 内 。 在 任务 内 ,异常 被 察 
党 并 且 不 必 屏 蔽 外 部 中 断 ,所 以 采用 陷阱 门 。 由 陷阱 门 指示 的 异常 处 理 程序 ,可 以 是 一 个 由 所 
有 任务 共享 的 过 程 (程序 ) ,如 果 这 样 安排 ,最 好 把 该 处 理 程序 置 于 全 局 地 址 空间 内 。 如 果 各 个 
任务 要 求 有 不 同 的 处 理 程序 ,那么 全 局 异常 处 理 程序 可 安排 一 张 表 来 保存 各 处 理 程序 的 入 口 
地 址 ,并 为 引起 异常 的 任务 调用 相应 的 处 理 程序 。 

通常 情况 下 中 断 请 求 与 正 执行 的 任务 没有 关联 ,采用 任务 门 提供 的 隔离 环境 ,可 使 得 中 断 
处 理 程序 能 够 独立 简便 地 处 理 请 求 。 对 于 要 求 快速 响应 的 中 断 请 求 ,通过 中 断 门 可 以 得 到 较 
好 的 处 理 。 因 为 中 断 请 求 随时 都 可 能 发 生 , 所 以 经 过 中 断 门 到 达 的 中 断 处 理 程序 ,必须 置 于 全 
局 地 址 空间 中 ,以 便 对 所 有 的 任务 都 有 效 。 

6. 中 断 或 异常 处 理 后 的 返回 

常常 用 指令 助 记 符 IRETD 明确 表示 操作 数 长 度 32 位 的 中 断 返回 指令 。 

中 断 返 回 指令 IRETD 用 于 从 中 断 或 异常 处 理 程序 的 返回 。 根 据 标志 寄存 器 EFLAGS 
中 的 任务 嵌 套 标志 NT 是 否 为 1, 该 指令 的 执行 分 为 两 种 情形 。 

(1) 标志 NT 为 1, 表示 嵌 套 任务 的 返回 。 当 前 任务 TSS 中 的 链接 字段 保存 着 指向 前 一 
任务 TSS 的 段 选择 子 , 取 出 该 选择 子 ,实施 任务 切换 就 完成 了 返回 。 在 从 经 过 任务 门 转 入 的 
中 断 或 异常 处 理 程序 返回 时 会 出 现 这 种 情形 。 但 是 ,在 从 经 过 中 断 门 或 陷阱 门 转 入 的 处 理 程 
序 返 回 时 ,不 会 出 现 这 样 的 情形 ,因为 在 经 过 中 断 门 或 陷阱 门 转 入 处 理 程序 时 ,标志 NT 已 被 
清 成 0。 

(2) 标志 NT 为 0, 表示 当前 任务 内 的 返回 。 这 种 情形 在 由 通过 中 断 门 或 陷阱 门 转 入 的 中 
断 或 异常 处 理 程 序 返 回 时 出 现 。 具 体操 作 步 骤 包 括 : 从 堆栈 顶 弹出 返回 指针 EIP 及 CS, 然后 
弹出 EFLAGS 值 。 弹 出 的 CS 段 选 择 子 中 的 RPL 字段 ,确定 返回 后 的 特权 级 。 如 果 RPL 字 
段 与 CPL 相同 ,那么 保持 相同 的 特权 级 。 若 RPL 字段 给 出 了 一 个 外 层 特 权 级 , 则 实施 特权 级 
变换 ,从 内 层 堆栈 中 弹出 外 层 堆栈 的 ESP 及 SS 的 值 ,参见 图 9. 34。 这 些 操作 步骤 与 段 间 转 
移 指 令 RETF 相似 。 弹 出 的 CS 段 选择 子 中 的 RPL 字段 决定 返回 后 的 CPL ,而 不 是 由 选择 子 
指示 的 段 描述 符 DPL 决定 返回 后 的 CPL ,因为 有 可 能 返回 到 不 在 DPL 给 定 的 级 执行 的 一 致 
代码 段 。 

对 于 提供 出 错 码 的 异常 ,异常 处 理 程序 必须 先 从 堆栈 中 弹出 出 错 码 , 然 后 再 执行 中 断 返 回 
指令 IRETD。 

中 断 返 回 指令 IRETD 不 仅 能 够 用 于 由 中 断 或 异常 引起 的 嵌 套 任务 的 返回 ,而 且 也 适用 
于 由 段 间 调用 指令 CALL 通过 任务 门 引起 的 嵌 套 任务 的 返回 。 如 9. 7. 5 节 所 述 , 在 执行 通过 
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任务 门 进行 任务 切换 的 CALL 指令 时 ,标志 寄存 器 中 的 标志 NT 被 置 1 ,表示 任务 岩 套 。 


9.8.4 中 断 处 理 的 演示 (示例 八 ) 


下 面 给 出 演示 中 断 处 理 的 示例 八 。 本 示例 的 逻辑 功能 是 ,在 屏幕 项 行 的 中 间 位 置 以 倒 计 
时 方式 显示 秒 数 ,直到 0 秒 为 止 。 

1. 演示 内 容 和 思路 

演示 内 容 包 括 : 外 部 中 断 处 理 程序 、 陷 阱 处 理 程序 中断 描 述 符 表 IDT 的 使 用 。 为 了 简 
化 ,不 启用 分 页 存储 管理 机 制 ,保持 特权 级 CPL 一 0, 不 考虑 任务 切换 。 

演示 思路 : 工作 程序 在 完成 初始 化 后 ,反复 判断 是 否 出 现 结束 标记 ,直到 出 现 结束 标记 为 
止 ; 由 定时 中 断 处 理 程序 控制 倒计时 , 当 倒 计时 结束 ,设置 结束 标记 ; 定时 中 断 处 理 程序 调用 
以 中 断 处 理 程序 形式 存在 的 显示 程序 ,实现 倒计时 的 显示 。 所 以 ,设计 安排 向 量 号 为 08H 的 
定时 中 断 处 理 程序 ; 设计 安排 向 量 号 为 FEH 号 的 显示 陷阱 处 理 程序 。 

2. 源 程序 组 织 和 清单 

除了 工作 程序 特征 信息 外 ,本 示例 依次 含有 以 下 组 成 部 分 。 

(1) 全 局 描述 符 表 GDT。 除 了 几 个 常用 的 描述 符 外 ,含有 作为 工作 程序 主体 的 演示 代码 
段 描述 符 和 数据 段 描述 符 , 还 含有 描述 定时 中 断 处 理 程序 所 使 用 的 代码 段 和 数据 段 , 还 含有 描 
述 显 示 程 序 所 使 用 的 代码 段 和 数据 段 。 

(2) 中 断 描述 符 表 IDT。 为 了 在 保护 方式 下 响应 中 断 和 处 理 异 常 , 必 须 安 排 IDT。 它 含 
有 256 个 门 描述 符 。 第 08H 号 是 一 个 通 向 定时 中 断 处 理 程序 的 中 断 门 , 第 FEH 号 是 一 个 通 
向 显示 处 理 程序 的 陷阱 门 。 把 其 余 254 项 都 安排 成 相同 的 陷阱 门 , 通 向 一 个 特殊 的 中 断 或 异 
常 处 理 程序 ,实际 上 ,如 果 一 切 正常 ,不 应 该 发 生 这 些 中 断 或 者 异常 。 

(3) 处 理 其 他 中 断 或 异常 的 特殊 处 理 程序 的 代码 段 。 

(4) 定时 中 断 处 理 程序 的 数据 段 和 代码 段 。 

(5) 以 陷阱 处 理 程序 形式 存在 的 显示 程序 的 数据 段 和 代码 段 。 

(6) 作为 演示 程序 主体 的 堆栈 段 .数据 段 和 代码 段 。 

(7) 实 方式 下 的 数据 和 代码 段 。 


示例 八 的 源 程序 如 下 : 
;演示 中 断 的 处 理 ( 示例 八 ,dpg8) 
% include =" DMC.H" 文件 BCH 含有 宏 的 声明 和 符号 常量 等 
; ;相关 符号 常量 声明 
EOIONM ey 2H ;外 部 中 断 处 理 结束 命令 
ICREGP ey 2H :中断 控制 寄存 器 端口 
IWREGP eq 2H ;中 断 屏 蔽 寄存 器 端口 
section text 段 text 
bits 16 :6 位 段 模式 
Head: 工作 程序 特征 信息 
HEADER end_of_text，Begin 2000H 
GDTSeg: ;全 局 描述 符 表 GOT 


Dumy DESORIPTIR 00000 
Normal DESORIPTOR C(OFFFFH 0.0. ATDW.O 
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Nomal_Sel eq Nomal- GTSeg 

InitGDT: ;GT 中 待 初始 化 描述 符 起 点 
;任务 的 临时 代码 段 描述 符 及 其 选择 子 

TerpCode CDESCRIPTO (FFFFH TCodeSeg 0ATCE 0 

TCode Sel eq Tambode- (DTSeg 

;任务 的 演示 代码 段 描述 符 ( 匀 位 段 ) 及 其 选择 子 
Democode ©DESCRIPTR LerDCode- 1.DCodeSeg 0 ATCE+ D32.0 
DOode Sel equ Demobode- (DTSeg 
:任务 的 数据 段 描述 符 

DemoData CDESCRIPTR LerDData- 1,DDataSeg 0 AIDW 0 
DData Sel equ DemoData - GDTSeg 

;任务 的 堆栈 段 描述 符 ( 匀 位 段 ) 及 其 选择 子 
DemoStack ~ DESCRIPTOR © LenStack- 1,StackSeg, 0 ATDW+ D32.0 
Stack Sel equ DemoStack- GDTSeg 

第 虽 号 中 断 处 理 程序 ( 显示 程 记 代码 段 描述 符 
Echocode ©DESORIPTR LenECode- 1,ECodeSeg, 0 ATCE+ D32.0 
EDode Sel equ Echo0ode - GDTSeg 

第 辐 号 中 断 处 理 程序 ( 显示 程 户 数据 段 描述 符 
EchoData CDESCRIPTR LerEData- 1,EDataSeg QAIDW 0 
EData Sel eq EchoData- GDTSeg 

第 咽 号 中 断 处 理 程序 代码 段 描 述 符 

TICode DESCRIPTOR LenTlCode- 1, TICodeSeg, 0. ATCE+ D32.0 
TlCode Sel equ TICode - GDTSeg 

第 咽 号 中 断 处 理 程序 数据 段 描 述 符 

TIData DESCRIPTOR LenTlDatar- 1, TIDataSeg 0. ATIDW 0 
TIData Sel equ TIData - GDTSeg 

;处 理 其 他 中 断 或 异常 的 特殊 处 理 程序 代码 段 描 述 符 
Other DESORIPTOR “Len0Code- 1, 00odeSeg, 0. ATCE+ D32.0 
other Sel eq Other - GDTSeg 

;GT 中 的 需要 进行 基地 址 初始 化 的 描述 符 个 数 
NnDesce 。 eq ($-InitoT /8 :gpT 中 待 初始 化 的 描述 符 个 数 
;视频 存储 段 的 描述 符 及 其 选择 子 

VidedWen DESCRIPTOR OFFFFH 8000H, CBH ATDNW,O 

Wem Sel eq VidecMem- GDTSeg 


alin 16 ;6 字 节 地 址 对 齐 
IDTSeg: ;中 断 描 述 符 表 IDT 
第 oo 的 8 个 陷阱 门 ,指向 其 他 中 断 /异常 处 理 程序 

tims 8 dw 0therBegin Other_Sel, ATTIGAT2<<8 0 
第 0 号 中 断 门 ,指向 定时 中 断 处 理 程序 
INTOB: 

dn TlBegin, TiCode Sel，ATIGAT2<<8 0 
第 FH 的 驶 个 陷阱 门 ,指向 其 他 中 断 /异常 处 理 程序 

times 254- 9 dw 0therBegin Other_Sel, ATTGAT322<<8 0 
第 [ 鲜 号 陷阱 门 ,指向 作为 软 中 断 处 理 程序 的 显示 程序 
INTFE GATE EchoBegin, EDode Sel, 0 ATTGAT2 0 
第 FH 号 陷阱 门 ,指向 其 他 中 断 / 异 常 处 理 程序 
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INTFF GATE OtherBegin, Other_Sel, 0 ATTGAT2 0 
LenlDlSeg eq $- IDTSeg 


:特殊 中 断 或 异常 处 理 程序 的 代码 自 


alin 16 ;6 字 节 地 址 对 齐 
bits 2 ;2 位 代码 段 
00odeSeg: 
OtherBegin equ $— 0CodeSeg ;处 理 程序 人 口 点 
MV 以 Wem Sel 
WwW Ex 
WW 用 4 ; 红 底 白字 
WwW AL 
MV [ES:g], MX 奉 屏 幕 左上 角 显 示 红 底 白色 符号 " 
JP $ 无 限 循环 


第 叫 号 (定时 中 断 处 理 程序 的 数据 自 


align 16 ;16 字 节 地 址 对 齐 
TIDataSeg: 
OOUNT eq $-TIDataSeg 

虽 0 ;计数 器 


第 叫 号 (时 钊 中 断 处 理 程序 的 代码 自 


alin 16 ;6 字 节 地 址 对 齐 
bits 32 乌 位 代码 段 
TICodeSeg: 
TlBegin equ $-TICodeseg ;中 断 处 理 程序 人 口 点 
PUSH EX ;保护 现场 
PUSH DS 
PUSH FS 
PUSH Gs 
MY AX TIData Sel 
WwW Ds ; 置 中 断 处 理 程 序数 据 段 
WW AM Eata Sel 
WW FSA ; 置 显示 处 理 服务 数据 段 
MY AMX DData Sel 
MW G6,M ; 置 任务 数据 段 
QP BYE [OU ,0 :判断 计数 器 值 
JZ TI2 ;计数 非 0 表示 未 到 一 秒 
MV BYE [ouNn ,18 每 秒 约 名 次 
INT OaH ;调用 F 晤 号 显示 服务 程序 
QP BYE [FS:MESS], '0' 沁 经 显示 到 符号 '0? 
J TI 
MV BYE [GSFUAG ,1 ; 当 显示 符号 '0 时 , 置 结束 标记 
TIt:DpEC EYE [FS:MESS] ;调整 显示 信息 ( 倒计时 ) 
TI2:DE BYTE [LONT] ;调整 计数 
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POP G6 
PP Fs :恢复 现场 

POP DS 

MW A, EIOM 

QT ICEGP AL ;通知 中 断 控制 器 中 断 处 理 结 束 
POP EX 

IRED ;中 断 返 回 


第 加 号 中 断 处 理 程序 ( 显示 程序 ) 的 数据 段 


align 16 ;16 字 节 地 址 对 齐 
EDataSeg: 
NESS eq $-Eataseg 
DB '9,4NH ; 倒 计 数 开始 符号 及 显示 颜色 


第 加 号 中 断 处理 程 序 ( 显示 程 记 的 代码 自 


align 16 ;16 字 节 地 址 对 齐 
bits 322 ; 乌 位 代码 段 
ECodeSeg: 
EhBegin eq $- EodSeg ;处 理 程序 入 口 处 
PUSH 以 
PUSH DS 
RsH E 
MY A Eata Sel 
MY DSMX ; 置 显示 服务 程序 数据 段 
MY AX Wen Sel 
WwW EX ; 置 视频 存储 区 段 
MW AX [WESS| : 取 显示 字符 和 颜色 
MV [ES:40k 习 , MX ;显示 符号 
POP BEB 
POP DS :恢复 现场 
POP MX 
IRED ;中 断 返 回 
lerECode eq $- EoodeSeg 
:任务 的 堆栈 段 
align 16 ;6 字 节 地 址 对 齐 
StackSeg: 


:任务 的 数据 段 
DDataSeg: 
RLAG eq $- DDataSeg 
[BB 0 ;工作 标志 
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;任务 的 代码 段 
alin 16 ;16 字 节 地 址 对 齐 
bits 32 ;2 位 代码 段 
DOodeSeg: 
DardBegin eq $- DOodeSeg 
WY AX Stack Sel 
MV Ss, AX ; 置 堆栈 
MY 。 ESP LenStack 
MY AX DData Sel 
MV DS, MX ; 置 数据 段 
MX Ex 
MX Fs 
MX 6 
WAL 11111110B ; 置 中 断 屏蔽 寄存 器 
OT INREGP AL ; 仅 开放 定时 中 断 
STI ; 开 中 断 
DemoConti 
QP BYE [RUAG ,0 浏 断 工作 标志 
DemOonti ;为 0 继续 ,否则 结束 
al 关中 断 
OVER: ; 转 回 临时 代码 段 , 准备 回 实 方式 
JWP Tcode Sel:PM Entry2 
LerD0ode eq $- DCodeSeg 
: 临 时 代码 段 
align 16 ;6 字 节 地 址 对 齐 
bits 16 ;6 位 代码 段 
TOodeSeg: 
ME eq $- ToodSeg ; 转 演 示 程 序 
JP DOode Sel:DemBegin 
FEnrty2 emu $- ToodSeg ;准备 切换 回 实 方式 
MX AX Nomal_sel 
WW Ds 以 
WwW Ex 
WwW FSA 
WW 6 
WW Ss 以 
WwW EX CR 
AD ”EAX OFFFFFFEH 
MV OR, EX ;返回 实 方式 
ToReal : ;真正 回 到 实 方式 
JWP OReal 
; 实 方式 下 的 数据 段 
alin 16 :6 字 节 地 址 对 齐 
RDataSEG: 


VGDTR PDESC LenGDTSeg- 1,0 ;GDT 伪 描 述 符 
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VIDTR PDESC LenlDTSeg -10 


; 实 方式 下 的 代码 段 
alin 16 
bits 16 
ROodeSEG: 
Begin: 


MX G 

Ds MX 
[ToReal+ 3, MX 
[VarESP], ESP 
[Varss], ss 


SI，InitGDT 
CX NnDescG 
InitDescBA 
SI，VGDTR 
BX GDTSeg 
InitPeDesc 
SI, VIDIR 
BX IDTSeg 
InitPeDesc 


天 瑟瑟 请 瑟 瑟 二 


@ 
EE 


LNORVIDTR] 


AL INREGP 
[LIMaskReg] ,AL 


‘8 


;IDT 伪 描述 符 
:用 于 保存 原 IDTR 值 
淘 存 堆栈 指针 





淘 存 中 断 屏蔽 寄存 器 值 


;6 字 节 地 址 对 齐 
;6 位 代码 段 


十 定位 


;保存 实 方式 下 堆栈 指针 


;设置 T 中 的 待 初始 化 描述 符 的 基地 址 


; 彻 始 化 用 于 GODR 的 伪 描述 符 


初始 化 用 于 IDIR 的 伪 描 述 符 


;保存 IDOR 值 





;保存 中 断 屏 项 字 节 
;装载 GOIR 
; 置 IDTR 


;准备 切换 到 保护 方式 


;进入 保护 方式 下 的 临时 代码 段 


;又 回 到 实 方式 
:恢复 实 方式 下 的 堆栈 指针 


恢复 IDTR 
:恢复 中 断 屏蔽 字 节 








OUT IMREGP, AL 

STI ; 开 中 断 

FETF ;返回 
% inelude =* PROG ASN" :包含 初始 化 阶段 的 相关 子 程序 
end_of_text: 源 代 码 到 此 为 止 


3. 关于 示例 八 的 说 明 

下 面 结合 源 程序 对 示例 八 进 行 说 明 ,与 以 前 示例 相同 部 分 ,不 再 袭 述 。 

(1) 对 IDT 表 的 初始 化 。 从 源 程序 可 知 , 中 断 描 述 符 表 IDT 含有 256 个 门 描述 符 。IDT 
表 中 这 些 门 描述 符 没有 32 位 段 基地 址 ,只 有 指示 中 断 或 异常 处 理 程序 人 口 点 的 选择 子 和 偏 
移 , 而 且 示 例 中 的 入 口 点 偏 移 值 也 比较 小 ,于 是 利用 门 描述 符 宏 GATE ,采用 预 置 的 方式 准备 
好 中 断 门 或 陷阱 门 。 所 以 ,在 初始 化 阶段 ,没有 像 初始 化 GDT 表 那 样 初始 化 IDT 表 。 当 然 ， 
还 是 需要 初始 化 用 于 中 断 描述 符 表 寄 存 器 IDTR 的 伪 描 述 符 ,这 与 初始 化 GDTR 的 伪 描 述 符 
一 样 。 

(2) 装载 和 保存 IDTR 寄存 器 。 只 有 重新 装载 中 断 描述 符 表 寄存 器 IDTR 之 后 ,示例 程 
序 自 带 的 中 断 描述 符 表 IDT 才 会 生效 。 为 了 回 到 实 方式 后 ,能 够 恢复 IDTR 的 原先 内 容 , 所 
以 要 先 保存 IDTR 的 内 容 。 本 示例 分 别 使 用 存储 和 装载 IDTR 寄存 器 的 指令 SIDT 和 指令 
LIDT 来 实现 相关 功能 。 这 些 指令 在 9. 3. 3 节 有 介绍 。 

(3) 定时 中 断 的 向 量 号 。 为 了 简单 明了 地 演示 在 保护 方式 下 响应 外 部 中 断 并 进行 处 理 ， 
本 示例 利用 定时 中 断 源 ,但 没有 通过 重新 设置 中 断 控制 器 的 方法 改变 对 应 的 中 断 向 量 。 在 
8.3.5 节 简单 介绍 过 定时 中 断 , 它 对 应 08H 号 中 断 向 量 。 因 此 ,定时 中 断 使 用 的 8H 号 中 断 向 
量 就 与 双重 故障 异常 对 应 的 中 断 向 量 号 冲突 。 但 本 示例 仅 是 演示 程序 ,所 以 只 要 保证 不 发 生 
双重 故障 异常 ,就 可 避免 冲突 ,就 不 会 影响 演示 。 

设置 中 断 屏蔽 寄存 器 , 仅 开放 时 钟 中 断 。 所 以 ,在 开 中 断 状 态 下 ,也 只 可 能 接收 到 定时 中 
断 , 而 不 会 接收 到 其 他 类 型 的 外 部 中 断 。 

(4) 定时 中 断 处 理 程序 的 设计 。 由 于 通过 中 断 门 转 入 定时 中 断 处 理 程序 ,因此 在 控制 转 
移 时 不 发 生 任务 切换 。 但 作为 外 部 中 断 , 随 时 可 能 发 生 , 因 此 中 断 处 理 程序 必须 采取 保护 现场 
等 措施 。 作 为 示例 程序 ,该 中 断 处 理 程序 检查 和 调整 在 其 数据 段 中 的 计数 器 ; 在 满 18 次 后 ， 
就 认为 已 满 一 秒 , 青 调整 用 于 显示 的 倒 计 数 信息 ; 如 果 倒 计数 信息 为 “0”, 表 示 已 经 完成 倒 计 
时 ,设置 位 于 任务 数据 段 中 的 标记 FLAG ,工作 程序 在 判断 到 该 结束 标记 时 ,将 终止 演示 。 该 
中 断 处 理 程序 通过 约定 的 数据 区 与 显示 程序 及 工作 程序 交换 信息 。 

(5) 由 陷阱 处 理 程序 实现 的 显示 。 为 了 演示 陷阱 及 其 处 理 , 把 显示 过 程 安排 成 陷阱 处 理 
程序 , 称 为 显示 程序 。 上 述 定 时 中 断 处 理 程序 ,通过 软 中 断 指令 INT 调用 该 显示 程序 ,显示 倒 
计时 数 。 在 控制 转移 时 ,也 没有 任务 切换 。 该 陷阱 处 理 程序 相当 于 一 个 “ 软 中 断 ”处 理 程序 。 

(6) 对 其 他 中 断 或 异常 的 响应 。 为 了 简单 ,除了 08H 号 和 FEH 号 向 量 外 ,中 断 描述 符 表 
IDT 中 其 他 的 门 均 通 向 同一 个 处 理 程序 ,由 它 处 理 其 他 中 断 或 异常 。 作 为 示例 程序 的 一 部 
分 ,处 理 过 程 极其 简单 ,在 屏幕 左上 和 角 显 示 蓝 底 白 色 的 符号 “!”, 然 后 进入 无 限 循环 。 实 际 上 ， 
按 示例 程序 现在 的 安排 ,不 可 能 发 生 这 种 情况 。 


9.8.5 异常 处 理 的 演示 (示例 九 ) 
下 面 给 出 演示 异常 处 理 的 示例 九 ,这 是 本 章 最 复杂 的 示例 。 本 示例 的 逻辑 功能 是 ,在 屏幕 
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上 显示 一 条 提示 信息 ,由 用 户 输 入 表示 模拟 异常 类 型 的 字符 ,然后 模拟 指定 的 异常 及 其 处 理 。 
特别 说 明 : 由 于 模拟 异常 ,因此 本 示例 最 好 在 物理 机 上 或 者 虚拟 机 Bochs 中 运行 ; 如 果 在 虚 
拟 机 VirtualBox 中 运行 ,不 应 该 选择 硬件 虚拟 化 技术 。 

1. 演示 内 容 和 思路 

本 示例 的 演示 内 容 包 括 : 除法 出 错 故障 处 理 、 溢 出 陷阱 处 理 、 段 不 存在 故障 处 理 、 堆 栈 段 
出 错 故障 处 理 和 通用 保护 故障 处 理 。 同 时 ,还 演示 通过 任务 门 的 任务 切换 。 另 外 ,与 示例 八 类 
似 , 再 次 演示 通过 陷阱 门 的 例 程 服务 。 为 了 简单 ,不 启用 分 页 存储 管理 机 制 , 保 持 特 权 级 
CPL=0。 

本 示例 安排 两 个 任务 : 工作 任务 和 键盘 任务 。 键 盘 任 务 的 功能 是 ,给 出 输入 提示 信息 , 接 
受用 户 按键 ,把 用 户 所 按 字符 保存 到 交换 缓冲 区 。 工 作 任 务 的 功能 是 ,根据 用 户 的 选择 ,模拟 
相应 的 异常 ,也 即 故意 引发 相应 的 异常 。 当 出 现 异 常 时 ,由 对 应 的 异常 处 理 程序 发 出 相应 信 
息 , 并 简单 地 处 理 异常 。 工 作 任 务 利用 键盘 任务 获取 用 户 的 选择 。 异 常 处 理 程序 调用 显示 例 
程 发 出 信息 。 

工作 任务 演示 代码 的 主要 步骤 如 下 。 

(1) 做 演示 的 准备 。 装 载 局 部 描述 符 表 寄 存 器 LDTR ,因为 工作 任务 使 用 的 部 分 描述 符 
在 LDT 中 。 装 载 任务 寄存 器 TR ,为 切换 任务 做 好 准备 。 建 立 工 作 任务 的 堆栈 ,设置 其 他 数 
据 段 寄存 器 。 

(2) 接收 要 模拟 的 异常 类 型 号 。 通 过 软 中 断 指 令 INT 调用 键盘 任务 完成 该 步骤 。 键 盘 
任务 只 有 在 接收 到 指定 的 字符 后 才 结 束 。 接 收 的 字符 是 0.4.B`C 和 D。 

(3) 按 接收 的 字符 模拟 异常 ,也 即 根据 用 户 键入 的 字符 ,执行 有 关 片 段 。 在 这 些 片段 中 ， 
有 意 安排 了 能 引起 有 关 故 障 或 陷阱 的 指令 。 

2. 源 程序 组 织 和 清单 

除了 工作 程序 特征 信息 外 ,示例 九 依 次 含有 以 下 组 成 部 分 。 

(1) 全 局 描述 符 表 GDT 和 中 断 描 述 符 表 IDT。 

(2) 陷阱 或 故障 处 理 程序 的 代码 段 。 为 了 充分 演示 ,有 意 把 相应 的 异常 处 理 程序 ,安排 在 
两 个 代码 段 。 

(3) 显示 出 错 代码 子 程序 的 代码 段 。 

(4) 实现 显示 功能 的 服务 例 程 的 代码 段 。 

(5) 键盘 任务 的 局 部 描述 符 表 LDT .任务 状态 段 TSS .堆栈 段 和 代码 段 等 。 

(6) 交换 缓冲 区 数据 段 。 

(7) 工作 任务 的 局 部 描述 符 表 LDT ,任务 状态 段 TSS ,堆栈 段 .代码 段 和 数据 段 等 。 


(8) 临时 代码 段 。 

(9) 实 方式 下 的 数据 和 代码 段 。 

示例 九 的 源 程序 如 下 : 

;演示 异常 的 处 理 ( 示例 九 ,dpg9) 

% include  ”DWCH" 文件 BCH 含有 宏 的 声明 和 符号 常量 等 
section text 最 text 
bits 16 ;6 位 段 模式 

Head: ;工作 程序 特征 信息 


HEADER end_of_text, Begin, 2000H 





GDTSeg: ;全 局 描述 符 表 GOT 

Dumy DESCRIPTR 00000 

Nomal DESCRIPTOR COFFFFH 0.0. ATDN.O 

Nomal_Sel eq Nomal- GDTSeg 

InitGDT: ;GT 中 待 初始 化 描述 符 起 点 
渔 时 代码 段 描 述 符 及 其 选择 子 


TenpCode DESCRIPTOR ”OFFFFH TOodeSeg, ,0ATCE 0 
TOode Sel eq TampCode- (DTSeg 

;工作 任务 的 55 段 描述 符 及 其 选择 子 

DeroTsS DESCRIPTOR ”LenDamoTSS- 1, DemoTSSeg, 0. ATTSS32.0 
DTSS Sel equ DeroTss- GDTSeg 

;工作 任务 的 DT 段 描述 符 及 其 选择 子 

DemoLDT DESCRIPTOR LenpLDT- 1, Demol DTSeg, QATLDT 0 
DLDT_Sel equ DerlDT- GDTSeg 

;工作 任务 的 代码 段 ( 了 Y 位 段 ) 描述 符 及 其 选择 子 
DemoCode DESORIPTOR ”LerDCode- 1, DCodeSeg 0 ATCE+ D82 0 
DOode Sel eq DemoCode- GDTSeg 

;工作 任务 的 缓冲 数据 段 描述 符 及 其 选择 子 

RFFR DESCRIPTOR ”LenBuffer- 1,BufferSeg, 0. ATDW.O 

YBuff Sel eq RFFER- GDTSeg 

;键盘 任务 的 TS 段 描述 符 及 其 选择 子 

KeyTsS DESCRIPTOR ”LenkeyTSS- 1, KeyTSSeg, 0 ATTSS32. 0 
KTSS_Sel equ KeyTss- GDTSeg 

;键盘 任务 的 LIT 段 描述 符 及 其 选择 子 

KeyDT DESCRIPTOR Lerk DT- 1, Key DTSeg, 0 ATLDT,O 
KDT_Sel equ KeyDT - GDTSeg 

;显示 服务 处 理 程序 代码 段 ( 也 位 段 ) 描述 符 及 其 选择 子 
Echo0ode DESCRIPTOR ”LenECode- 1, ECodeSeg, 0. ATCE+ D32.0 
EDode Sel eq Echo0ode - GDTSeg 

浮 程 序 代码 段 ( 也 位 段 ) 描述 符 及 其 选择 子 

Sub0ode DESCRIPTOR ”LenSCode- 1, SCodeSeg 0 ATCE+ D82 0 
Stode Sel eq SibCode- GDTSeg 

;异常 处 理 程序 代码 段 甲 的 描述 符 

EXCEPTAA DESCRIPTOR ”LenEXCSegAr- 1, ExCodeSegAA Q ATCE+ D92.0 
ExAA_Sel equ EXCEPTAA- GDTSeg 

;异常 处 理 程序 代码 段 乙 的 描述 符 

EXOEPTBB DESCRIPTOR ”LenEXCSegBB- 1, EXCodeSespB 0. ATCE+ D32.0 
EBB_Sel equ EXCEPTEB- GDTSeg 

NnDescG eq ($-InitT) /8 :gpT 中 待 初始 化 的 描述 符 个 数 
;视频 存储 段 的 描述 符 ( 基地 址 为 B8000H) 及 其 选择 子 
VidedWen DESCRIPTOR ”OFFFFH 8000H (BH ATIDN 0 

Wen Sel equ VidedWem- GDTSeg 


LenGDT eq $-GDTSeg 
alig 16 
IDTSeg: ;中 断 描述 符 表 IDT 


第 QH 号 陷阱 门 ( 通 向 除法 出 错 故障 处 理 程序 ) 
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INTOO GANIE DIVBegin, ExAA Sel,Q.ATTOAT32.0 
;从 0-- 0H 的 3 个 陷阱 门 

times 3 dy OtherBeginEBB _Sel,ATTGAT2<< 80 
第 咱 号 陷阱 门 ( 通 向 溢出 陷阱 处 理 程序 ) 
INTO4 GANIE OFBegin, ExAA_ Sel, QATTOAT32.0 
;从 5- OH 的 6 个 陷阱 门 

times 6 dy 0therBegin ElBB _Sel,ATTGAT2<<80 
第 ONH 号 陷阱 门 ( 通 向 段 不 存在 故障 处 理 程序 ) 
INTOB GAIE SNPBegin ExA_Sel,QATIGAT2.0 
第 OH 号 陷阱 门 ( 通 向 堆栈 段 故 障 处 理 程序 ) 
INTOC GATE SSEBegin EBB_Sel, QATTOAT32.0 
第 QH 号 陷阱 门 ( 通 向 通用 故障 处 理 程序 ) 
INID GATE GPBegin EBB Sel,0.ATTOAT32.0 
;从 EE- BEH 的 20 个 陷阱 门 

times 20 dy OtherBegin, EBB Sel,ATTGAT2<<80 
第 器 号 陷阱 门 ( 通 向 显示 程序 ) 


INTFE GATE EchoBegin, ECode Sel,QATTGAT2 0 
;第 FH 号 任务 门 ( 通 向 键盘 中 断 处 理 任务 ) 
INTFF GATE Q.KTSS_Sel, 0 ATTASKGAT,O 
LenIDT eq $- IDTSeg 
alin 16 ;16 字 节 对 齐 
bits 2 ;2 位 段 模式 
;异常 处 理 程序 的 代码 段 甲 
ExCodeSegAA: 
DIVBegin equ $- EodeSegAA :除法 出 错 故障 处 理 程序 入 口 点 
MY ESI, MESSO ;提示 信息 
WW El,0 ;显示 的 起 始 位 置 
INT a ;显示 提示 信息 
SR 以 1 ;处 理 模 拟 的 除法 错误 
IRED ;返回 
OFBegin equ $ -ExCodeSegAA ;溢出 陷阱 处 理 程序 人 口 点 
MV ESI, MESS4 ;提示 信息 
MV Bl,0 ;显示 的 起 始 位 置 
INT OH ;显示 提示 信息 
IRED ;返回 
SPBegin eq $- ECodSeeAA 逆 不 存在 故障 处 理 程序 入 口 点 
MW Esl, 
WwW Bl,0 
INT HH ;显示 提示 信息 
POP EX ;弹出 出 错 代码 
CAL SCode Sel:SUBBegin ;显示 出 错 代码 
POP EX ; 先 弹出 返回 地 址 
AD EX2 ;再 根据 引起 段 不 存 故障 指令 的 长 度 Ma1 





;异常 处 理 程序 的 代码 段 乙 
ExCodeSesPB 
SSEBegin eq $- ExCodeSegB 


如 3 
$F 
~ 
i 


;调整 返回 地 址 


;16 字 节 对 齐 
汉 位 段 模式 


;堆栈 段 故 障 处 理 程序 入 口 点 


;显示 提示 信息 

;弹出 出 错 代 码 

;显示 出 错 代 码 

; 先 取 得 返回 地 址 

; 跳 过 引起 堆栈 段 故 障 的 指令 Me 2 
:把 调整 后 的 返回 地 址 压 人 堆栈 


;通用 保护 故障 处 理 程序 入 口 点 


;保护 部 分 现场 


;提示 信息 
;显示 提示 信息 的 位 置 

;显示 出 现 故 障 的 提示 信息 

;从 堆栈 中 取 故 障 的 出 错 代码 /@3 
;调用 例 程 ,显示 出 错 代码 
恢复 部 分 现场 

;简单 地 调整 返回 地 址 Me4 
;废除 堆栈 中 的 出 错 代码 

;其 他 中 断 / 异 常 处 理 程序 人 口 点 
;提示 信息 首 地 址 偏 移 


;显示 提示 信息 
;进入 无 限 循环 
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align 16 ;16 字 节 对 齐 
bits 32 ;也 位 段 模式 
;显示 出 错 代码 子 程序 的 代码 段 
SCodeSeg: 
SUBBegin eq $— SCodesSeg 
PUSH EX ;以 含 出 错 代码 
PUSH EX 
PUSH EX ;保护 部 分 现场 
PUSH ESI 
PUSH EI 
MY ESI, ERRODE 
WwW DA 
WwW EX4 
.S1:ROL DX 4 ;把 1 位 出 错 代码 
WwW AD ; 转 成 4 位 十 六 进 制 数 的 Asoll 码 
AD A OH ;并 保存 
AD A 30H 
OP AL '9 
JE .9 
AD AL7 
.S2:MOV [ES ,人 
IN ESI 
LoP .Ss 
WY ESI, FRRVESS 
WwW El,2 8 :在 第 2 行 首开 始 
INT aH ;调用 自 带 的 服务 功能 ,显示 出 错 代码 
POP BI 
POP ESI 
POP EX :恢复 部 分 现场 
POP EX 
POP EX 
REF 
LenSCode eqy $— SCodeSeg 
alim 16 ;16 字 节 对 齐 
bits 32 ;也 位 段 模式 
;实现 显示 功能 的 服务 程序 ( 陷阱 处 理 程序 形式 ) 的 代码 段 
ECodeSeg: 
EhBegin eq $- ECodesSeg 
;DS:ES1 指向 显示 信息 串 , ES: 印 | 指向 显示 缓冲 区 
PUSHAD ;保护 现场 
aD 
W 人 Ah 4 ; 红 底 黄 字 
MV A 2H ;空格 
MV EX gr 2 ;每 行 8 个 字符 
PUSH BI 
RP ST ;显示 空格 ( 清空 指定 行 及 下 一 行 ) 





POP BI 
E1:LODSB 
R ALA 
了 已 
STOSN ;显示 指定 信息 
JP SHRT.EI 
E2:POPAD ;恢复 现场 
IRED ;返回 
lerECode eq $- EoodeSeg 
align 16 ;16 字 节 对 齐 
;键盘 任务 的 局 部 描述 符 表 LDT 


Key DTSeg 
;键盘 任务 的 代码 段 描 述 符 及 其 选择 子 
KeyCode DESORIPTOR (FFFFH KOodeSeg 0 ATCE,0 
Koode Sel eq (KeyCode- Ke DTSeg)+ TIL 
;键盘 任务 的 堆栈 段 描 述 符 及 其 选择 子 
KeyStack ~ DESORIPTIOR © LerkStack- 1,KStackSeg, OATIDW 0 
KStack_Sel equ (KeyStack- KeyLDTSeg)+TIL 
NnDesck. eq ($-KedDTSeg) /8 ;键盘 任务 DT 中 描述 符 个 数 
Lerk DT equ $-KeyDTSeg 
align 16 ;16 字 节 对 齐 
;键盘 任务 的 TS 段 
KeyTSSeg: 
00 ;链接 字 
0 ;0 级 堆栈 指针 
00 
0 妆 级 堆栈 指针 
00 
0 ?2 级 堆栈 指针 
00 


和 


KeyBegin, 0 EIR 入 口 点 偏 移 ) 
0 


: 


进入 时 的 堆栈 项 偏 移 ) 


是 号 -旺旺 -时 -是 -号 - 避 - 旺 - 号 - 避 - 号 遇 局 旺 吕 量 - 号 . 旺 : 昌 - 旦 - 号 - 显 


芭 驴 雏 攻 芭 四 耻 电 下 两 让 庙 妖 
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DN Nomal Sel, 0 
DN KDT sel, 0 

W 0 

DN $+2 KeyTlSSeg 
DB Om 


;GS 

:LDT 

;TSS 的 特别 属性 字 

:指向 I 许可 位 图 区 的 指针 
;0 许可 位 图 结束 字 节 


align 16 


键盘 任务 代码 段 ( 6 位 段 ) 


alin 16 
bits 16 
KOCodeSeg: 
KeyBegin eq $- KOodeSeg 
PUSH DS 
PUSH ES 
PUSH FS 
PUSH GS 
MW A Normal_Sel 
WW SSA 
MW EMX OO 
AD EM OFFFFFFFEH 
MY C0 EX 
ToReal2: 
JP 0:Getkeyl 
Getkey1: 
WW 从 G 
WW DA 
WW EP, EP 
MXV SS [SSVar] 
MV Sp, [SPVar] 
LIDT [NORVIDTR] 
STI 
Getkey2: 
MV Sl, Prapt 
WwW AH 人 4 
MV Bo 
.L1:LODSB 
RR ALA 
工 Getkey3 
INT 10 
JP SHRT .LI 


;16 字 节 对 齐 
;16 位 段 模式 


;准备 回 到 实 方式 


; 回 到 实 方 式 
;真正 回 到 实 方式 
;需要 重 定位 
;现在 是 实 方式 


恢复 实 方式 部 分 现场 

;LSS Sp, [SPvar] 

:恢复 实 方式 下 的 堆栈 指针 
恢复 实 方式 下 的 中 断 向 量 表 


;调用 BIOS 功能 ,显示 提示 信息 


;TY 方式 显示 
;0 页 


;学 符 串 以 0 结尾 
;调用 BIOS, 显示 字符 


;调用 BIOS 功能 ,接受 键盘 输入 





16H ;调用 BI0S, 取得 键盘 输入 
A '0' ;只 有 [04BGD 有效 


有 L 4 ;只 有 [04BGD5 有 效 
AL 11011111B ;学 母 小 写 转 大 写 
及 MB 


Getkey3 
AL 'D' ;只 有 [04BCGD 有效 


10H ;显示 所 按 字符 


[kewar] , AL ;保存 到 交换 缓冲 数据 段 


INT 10 :形成 回 车 换行 的 效果 

Ql ;准备 再 次 进入 保护 方式 

OR 

MW CRO EX ;再 次 进入 保护 方式 

JWP 

AX, KStack_Sel ;又 到 了 保护 方式 
;键盘 任务 结束 ,返回 

KeyBegin ;下 次 进入 任务 时 的 和 人口 点 Ma5 


LerkCode ”eq $— KOodeSeg 


;交换 缓冲 区 数据 段 
align 16 ;16 字 节 对 齐 
BufferSeg: 
KeyASCI1 eq $- BufferSeg 
KeyVar 中 0 
Buffer eq $- BufferSeg 


tims 18 中 0 
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江 作 任务 的 局 部 描述 符 表 段 

align 16 ;16 字 节 对 齐 
DemoLDTSeg: 
;工作 任务 的 堆栈 段 描述 符 及 其 选择 子 
DemoStack DESCRIPTOR LerDStack— 1,DStackSeg, 0.ATDW+ D32.0 
DStack_Sel equ ( DemoStack- Demol DTSeg)+ TIL 
;工作 任务 的 数据 段 描述 符 及 其 选择 子 
DEMODAIA DESCRIPTOR LerDData- 1,DDataSeg 0 ATDN.O 
DData Sel equ (DEMDATA- Dema DTSeg)+ TIL 
为 模拟 段 不 存在 故障 而 安排 的 数据 段 描述 符 
TESIPS DESCRIPTOR (OFFFFH 0.0.ATDW- 8H0 i/N 
ThNPS Sel equ (TESTINPS- Dema DTSeg)+ TIL 
;该 UT 中 需要 初始 化 基地 址 的 描述 符 个 数 
DemocLDNM equ 〈($-DemoLDTSeg) /8 
LeDDT eq $- DamcLDTSeg 


alig 16 ;16 字 节 对 齐 


align 16 ;16 字 节 对 齐 


;工作 任务 的 数据 段 
DDataSeg: 
NESSO equ $- DDataSeg 

DB 'Divide Error Exceptior( #DE) ',0 
NESS4 eq $- DDataSeg 

DB "Qerflow Exceptior( #OF) ',0 
ESSB equ $- DDataSeg 

DB 'Segment Not Present( #NP) ',0 
NESSC emu $- DDataSeg 

DB 'Stack Fault Exceptior( # SS) ',0 
equ $- DDataSeg 

DB 'General Protection Exceptiat( #GP) ',0 
MESSOTHER equ $- DDataSeg 

DB 'Other Execption',0 
BRRVESS eq $- DDataseg 

DB "Error Code= 
ERRODE eq $- DDataseg 





;工作 任务 代码 段 ( 演示 代码 段 ) 
align 16 
bits 了 
DOodeSeg: 
DarBegin eq $- DOodeSeg 
MW A DDT sel 
UDT 以 
MY A DStack Sel 
WW Sm 
MW Esp, LerpDStack 
;使 得 人 指向 工作 任务 的 TSS 
MY AX DISS Sel 
LR MX 
ge 
从 DData Sel 
DS A 
MW AX Wem Sel 
WwW EM 
WW A YBuff_ sel 
WW FSM 
WW A YBuff Sel 
WW GM 


;16 字 节 对 齐 
;也 位 段 模式 


;装载 DIR 


; 置 堆栈 指针 


:工作 任务 数据 段 
;视频 存储 区 

数据 交换 缓冲 区 段 
数据 交换 缓冲 区 段 


;接收 需要 模拟 的 异常 的 类 型 号 ( 由 字符 表示 ) 


INT OFFH 


;根据 接收 到 的 字符 ,分 别 故意 引起 相应 的 异常 ( 模拟 ) 


MN ”AL [FS:KeyASCI 
QP 人 LI'0 
a Demo4 


ss 


§ 


ER 


A 1000 
G2 


Demo11: 


模拟 除法 出 错 故障 


; 商 太 大 ,将 引起 除 出 错 异常 
;本 指令 长 2 字 节 /J@6 


模拟 溢出 陷阱 


单字 节 有 符号 数 最 大 为 1Z7, 使 得 号 


; 因 O 听 1, 将 引起 异常 /@7 


模拟 段 不 存在 故障 
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WW A TPS Sel 

WW GM 

JP OR 
Demo12: 

OP AL'C' 

JZ ”Demo13 
Exception12: 

WwW EX EP 

MV AL [Ss:EBX] 

JP OR 
Dero13: 
Exception13: 

MW AX DISS Sel 

WW 6 
OVER: 


alin 16 


RiLErty2 eq $- ToodSeg 


WY AX Nomal_Sel 
WW DX 
WwW EX 
WwW FSA 
WW GM 
WW SSA 
WwW EX CR 
AD EM OFFFFFFEH 
WwW OO EX 
ToReal : 
JP 0:Real 
; 实 方式 下 的 数据 段 
RDataSeg: 
VGDTR PDESC LentDT- 1,0 
VIDTR PDESC LenIDT- 1,0 
NORMVIDTR PESC 了 FH0 
SPVar DY 0 
SSVar DY 0 
Prampt DB 


”Strike a key [04BCD:” 





北 选 择 子 指示 描述 符 的 P 位 =0 
:3 起 段 不 存在 故障 ( 指令 长 2 字 节 ) 
; [/@8 


模拟 堆栈 出 错 故障 


超出 堆栈 边界 ( 指令 长 3 字 节 ) //@9 


模拟 通用 保护 故障 
;这 是 指示 TS 描述 符 的 选择 子 
把 TS 作为 数据 段 ( 指令 长 2 字 节 ) 


转 临时 代码 段 
;16 字 节 对 齐 
;6 位 段 模式 

转 演示 程序 
;准备 切换 回 实 方式 
;加 载 规范 描述 符 


;返回 实 方式 
;真正 进入 实 方式 





;GDT 伪 描 述 符 
:IDT 伪 描述 符 

;用 于 保存 原 IDIR 值 

; 暂 存 实 方式 的 堆栈 指针 


0 ;提示 信息 
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; 实 方式 下 的 代码 段 


bits 


Begin: 


和 主 症 二 是 二 EFEEWEEEEEEEEENEEEED 


§- 


Ql 


16 


MX G 
Ds MX 

[ToReal+ 3, MX 
[ToReal2+ I, MX 


SI，InitGDT 





汪 定 位 ( 调整 返回 指令 中 的 段 值 ) 
重 定 位 ( 调整 另 一 处 返回 指令 中 的 段 值 ) 


按 位 移 ,设置 @T 中 的 描述 符 基地 址 


;初始 化 用 于 GDR 的 伪 描述 符 


;初始 化 用 于 IDIR 的 伪 描 述 符 


;初始 化 工作 任务 LIT 


;初始 化 键盘 任务 LIT 
;初始 化 工作 任务 TSS 

:把 工作 任务 LIT 的 选择 子 填 和 人 TSS 
;保存 堆栈 指针 

;保存 IDIR 值 

;装载 GTR 

; 置 IDR 

;准备 切换 到 保护 方式 

;进入 保护 方式 下 的 临时 代码 段 
;又 回 到 实 方式 

恢复 实 方式 下 的 堆栈 指针 
恢复 原 IDIR 


; 开 中 断 
;结束 演示 ,返回 
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% include = " PROC. ASM" ;包含 初始 化 阶段 的 相关 子 程序 

end_of_text: 源 代 码 到 此 为 止 

3. 关于 示例 九 的 说 明 

在 中 断 描述 符 表 IDT 的 安排 和 显示 服务 例 程 的 实现 等 方面 ,与 示例 八 类 似 ,不 再 袭 述 。 
下 面 结合 源 程序 ,就 有 关 异 常 处 理 程序 的 实现 和 键盘 任务 的 实现 作 些 说 明 。 

(1) 除法 出 错 故障 处 理 程 序 的 实现 。 从 源 程 序 “//@6” 行 可 知 , 除 法 出 错 是 在 执行 故意 安 
排 的 被 除数 为 1000 ,而 除数 为 2 的 无 符号 除法 指令 时 引起 。 作 为 模拟 演示 ,除法 出 错 故障 处 
理 程序 先 显示 一 条 提示 信息 ,然后 把 存放 被 除数 的 AX 内 容 右 移 一 位 ,就 返回 。 除 法 出 错 属 于 
故障 ,在 故障 处 理 结束 返 回 后 , 仍 执行 该 无 符号 除法 指令 。 显 然 ,将 再 次 引起 同样 的 故障 , 仍 把 
被 除数 右 移 一 位 。 但 由 于 每 次 处 理 时 都 把 被 除数 减 半 , 因 此 经 过 几 次 故障 处 理 后 就 不 再 发 生 
该 故障 。 

(2) 溢出 陷阱 处 理 程序 的 实现 。 引 起 溢出 陷阱 的 是 源 程序 “//@7” 行 指令 INTO。 作 为 
模拟 演示 的 溢出 陷阱 处 理 程序 比较 简单 。 先 显示 一 条 提示 信息 ,然后 就 返回 。 因 为 溢出 异常 
归 入 陷阱 这 一 类 ,所 以 在 陷阱 处 理 结束 后 ,就 直接 返回 到 引起 陷阱 的 指令 的 下 一 条 指令 。 

(3) 段 不 存在 故障 处 理 程 序 的 实现 。 从 源 程序 可 知 , 段 不 存在 故障 是 在 执行 故意 安排 的 
把 一 个 选择 子 送 段 寄存 器 GS 的 指令 时 引起 。 该 选择 子 指示 的 描述 符 中 的 存在 位 P 被 故意 安 
排 为 0, 表 示 对 应 段 不 在 内 存 , 参 见 源 程序 “//@N” 行 。 在 正常 情况 下 , 段 不 存在 故障 处 理 程序 
应 该 把 对 应 的 段 装 入 内 存 , 再 把 描述 符 内 的 P 位 修改 为 1, 于 是 ,在 故障 处 理 结 束 后 ,引起 故障 
的 指令 可 得 到 顺利 执行 。 为 了 简单 ,这 里 安排 的 故障 处 理 程 序 先 显 示 一 条 提示 信息 ,然后 显示 
出 错 码 ,最 后 调整 堆栈 中 的 返回 地 址 并 返回 。 段 不 存在 故障 提供 一 个 出 错 码 ,该 故障 处 理 程序 
利用 POP 指令 把 它 从 堆栈 中 弹出 ,这样 堆栈 指针 就 指向 返回 地 址 。 巾 于 段 不 存在 异常 归 人 故 
障 这 一 类 ,因此 返回 点 是 引起 故障 的 指令 。 为 了 避免 再 次 引起 故障 ,作为 模拟 的 故障 处 理 程 序 
仅仅 调整 了 堆栈 中 的 返回 地 址 ,参见 源 程序 “//@1” 行 ,使 其 指向 下 一 条 指令 ,也 即 源 程序 
“//@8” 行 的 指令 。 

(4) 堆栈 段 出 错 故障 处 理 程序 的 实现 。 引 起 堆栈 出 错 故障 的 原因 有 多 种 ,示例 通过 执行 
故意 安排 的 偏 移 超过 段 界 限 的 堆栈 段 访问 指令 来 模拟 堆栈 段 出 错 故 障 的 产生 ,参见 源 程序 
“//@9” 行 。 作 为 模拟 演示 的 堆栈 出 错 故 障 处 理 程序 比较 简单 , 先 显 示 一 条 提示 信息 ,然后 显 
示 出 错 码 ,最 后 调整 堆栈 中 的 返回 地 址 并 返回 ,参见 源 程序 *//@2” 行 。 

(5) 通用 保护 故障 处 理 程序 的 实现 。 引 起 通用 保护 故障 的 原因 有 多 种 ,示例 通过 把 一 个 
指向 系统 段 描述 符 的 选择 子 装 入 数据 段 寄存 器 GS 来 模拟 通用 保护 故障 的 产生 。 作 为 模拟 演 
示 的 通用 保护 故障 处 理 程序 , 像 上 述 两 个 故障 处 理 程序 一 样 比较 简单 , 先 显 示 一 条 提示 信息 ; 
然后 显示 出 错 码 ,最 后 调整 堆栈 中 的 返回 地 址 并 返回 。 但 在 废除 堆栈 中 的 出 错 码 和 调整 堆栈 
中 的 返回 地 址 时 采用 了 其 他 方法 ,参见 源 程 序 “//@3” 行 和 “//@4” 行 。 

(6) 异常 处 理 程序 的 一 般 说 明 。 在 本 示例 中 , 通 向 上 述 各 种 异常 处 理 程序 的 门 都 是 陷阱 
门 。 所 以 在 发 生 异 常 而 转 入 这 些 异 常 处 理 程 序 时 ,都 不 发 生 任务 切换 。 于 是 ,这 些 异常 处 理 仍 
作为 工作 任务 的 一 部 分 。 正 常情 况 下 ,异常 处 理 程序 应 该 注意 现场 的 保护 和 恢复 ,但 为 了 简 
单 , 作 为 模拟 演示 的 异常 处 理 程序 没有 能 够 切实 地 保护 现场 。 注 意 , 这 些 异 常 处 理 程序 采用 的 
处 理 方法 与 故意 安排 的 引起 异常 的 指令 有 关 , 不 适用 于 一 般 情 况 。 

(7) 显示 出 错 代码 的 过 程 。 本 示例 采用 一 个 子 程序 来 显示 部 分 异常 所 带 的 出 错 代码 ,该 
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子 程序 的 入 口 参数 是 AX 含 出 错 代 码 。 利 用 该 子 程序 不 仅 缩短 程序 长 度 , 而 且 也 用 于 表现 异 
常 处 理 程序 的 实现 。 

(8) 键盘 任务 的 实现 。 在 本 示例 的 中 断 描 述 符 表 IDT 中 ,第 FFH 号 门 描述 符 是 任务 门 ， 
指向 一 个 独立 的 任务 。 键 盘 任 务 的 功能 是 读 取 键盘 ,接收 一 个 指定 范围 内 的 字符 。 工 作 任务 
代码 通过 “INT 0FFH” 指 令 调 用 它 ,接收 一 个 表示 希望 模拟 异常 的 字符 。 

为 了 简单 ,键盘 任务 在 实 方式 下 读 键盘 ,接收 指定 范围 内 的 字符 。 因 此 ,键盘 任务 每 次 经 
历 以 下 步骤 : @ 转 回 到 实 方式 。 此 前 要 做 必要 的 准备 , 回 到 实 方式 后 ,要 恢复 必须 的 实 方式 下 
的 部 分 现场 。@ 接 收 指定 的 字符 。 调 用 BIOS 功能 显示 提示 信息 ,调用 BIOS 读 键盘 ,如 果 用 
户 所 按 字符 在 指定 范围 内 ,就 显示 所 按 字符 ,并 保存 到 约定 的 交换 缓冲 区 。@ 转 回 到 保护 方 
式 , 此 前 也 要 做 必要 的 准备 。 

尽管 在 任务 切换 时 ,自动 利用 TSS 保护 和 恢复 现场 ,但 由 于 键盘 任务 相当 于 一 个 读 取 键 
盘 的 子 程序 ( 例 程 ) ,因此 在 开始 任务 时 ,还 通过 堆栈 保护 必要 的 现场 ,在 结束 任务 时 恢复 现场 。 
请 特别 注意 ,安排 在 该 任务 代码 段 中 的 IRETD 指令 之 后 的 转移 指令 的 作用 ,参见 源 程序 
“//@5” 行 。 


9.9 保护 机 制 小 结 


基于 描述 符 ,控制 门 和 特权 级 ,IA-32 系列 CPU 提供 完善 的 保护 机 制 , 有 效 地 支持 操作 系 
统 建立 多 任务 运行 环境 。 


9.9.1 转移 途径 小 结 


只 有 通过 段 间 转 移 的 途径 ,才能 进行 实 方式 与 保护 方式 之 间 的 转换 ,才能 进行 任务 内 不 同 
特权 级 之 间 的 变换 ,才能 进行 多 个 任务 之 间 的 切换 。 段 间 转 移 指 令 JMP、 段 间 调 用 指令 
CALL、 段 间 返 回 指 令 RETF 、 软 中 断 指令 INT 和 中 断 返回 指令 IRETD ,都 具有 实施 段 间 转移 
的 功能 。 此 外 ,响应 中 断 或 者 处 理 异常 也 必定 导致 段 间 转移 。 

1. 任务 切换 的 途径 

任务 之 间 切 换 的 途径 如 图 9. 35 所 示 。 段 间 转 移 指 令 JMP、 段 间 调 用 指令 CALL、 软 中 断 
指令 INT 和 中 断 返回 指令 IRETD 引起 的 任务 切 
换 是 主动 的 任务 切换 ,或 者 说 是 当前 任务 要 求 的 任 
务 切换 。 中 断 和 异常 (不 包括 软 中 断 指 令 ) 引 起 的 





JMP、 CALL 
可 用 TSS 














任务 切换 是 被 动 的 任务 切换 ,或 者 说 是 不 受 当 前 任 : JMP 、CALL 、INT、 中 断 /异常 和 

务 左右 的 任务 切换 。 甲 任务 门 乙 
任务 切换 意味 着 运行 环境 的 切换 ,意味 着 线性 

地 址 空间 的 切换 。 这 样 能 够 实现 各 个 任务 存储 空 RETD 

间 之 间 的 隔离 。 当 然 ,操作 系统 自身 是 由 各 个 任务 NE SS 

共享 的 。 图 9.35 任务 之 间 切换 的 途径 


从 任务 甲 切 换 到 任务 乙 时 ,必须 符合 特权 级 保 
护 规则 ,防止 随意 进行 任务 切换 。 

在 任务 切换 期 间 , 将 进行 多 方面 的 保护 检测 ,如 果 察 觉 到 出 现 某 种 错误 条 件 , 那 么 将 引起 
异常 。 于 是 对 应 的 异常 处 理 程序 得 到 运行 ,它们 会 排除 故障 ,或 者 会 终止 任务 。 
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伴随 着 任务 切换 ,特权 级 当然 可 能 发 生变 换 。 只 要 任务 切换 发 生 ,这 种 特权 级 的 变换 取决 
于 目标 任务 ,而 与 当前 特权 级 无 关 。 

2. 任务 内 特权 级 变换 的 途径 

任务 内 特权 级 变换 的 途径 如 图 9. 36 所 示 。 图 9. 36 中 特权 级 mm 是 内 层 特权 级 ,特权 级 是 
外 层 特权 级 。 通 常情 况 下 , 段 间 返回 指令 RETF 与 段 间 调 用 指令 CALL 相对 应 ; 中 断 返 回 指令 
IRETD 与 软 中 断 指令 INT. 中 断 或 异常 相对 应 。 但 是 ,可 以 首先 在 内 层 堆栈 中 建立 合适 的 环境 ， 
然后 使 用 段 间 返回 指令 RETF 或 者 中 断 返 回 指令 IRETD 从 内 层 特权 级 变换 到 外 层 特权 级 。 

从 外 层 特权 级 变换 到 内 层 特权 级 时 ,必须 符合 特权 级 保护 规则 ,必定 经 过 涉及 当前 特权 级 
CPL ,请 求 特 权 级 RPL 和 描述 符 特权 级 DPL 之 间 关 系 比 较 的 特权 级 检测 。 外 层 的 应 用 程序 
可 以 调用 内 层 的 子 程序 或 者 内 层 的 例 程 ( 服 务 程 序 ) ,由 相对 内 层 的 程序 实施 相对 重要 的 数据 
存 取 和 操作 处 理 。 这 种 方式 与 一 般 管理 采用 的 方式 是 相同 的 ,也 即 相 对 重要 的 事项 ,由 相对 重 
要 的 人 员 处 理 或 者 决定 。 所 以 ,只 有 操作 系统 内 核 才 具有 特权 级 0, 也 即 最 高 特权 级 ,只 有 操 
作 系 统 内 核 才 能 实施 最 重要 的 操作 处 理 。 

伴随 着 特权 级 变换 ,使 用 的 堆栈 发 生变 换 。 这 样 能 够 防止 外 层 程 序 从 堆栈 中 获取 内 层 程 
序 的 各 种 信息 。 

在 特权 级 变换 期 间 ,将 进行 多 方面 的 保护 检测 ,如 果 察 觉 到 出 现 某 种 错误 条 件 , 那 么 将 引 
起 异常 。 于 是 对 应 的 异常 处 理 程序 得 到 运行 ,它们 会 排除 故障 ,或 者 会 终止 任务 。 

3. 任务 内 相同 特权 级 转移 的 途径 

任务 内 相同 特权 级 转移 的 途径 如 图 9. 37 所 示 。 由 图 可 知 ,任务 内 相同 特权 级 转移 的 途 
径 多 种 多 样 。 实 际 上 ,因为 不 涉及 特权 级 变换 ,也 不 涉及 任务 切换 ,所 以 尽 可 能 便于 程序 员 
按 需 应 用 。 当 然 , 段 间 转移 期 间 会 进行 保护 检测 ,如 果 察 觉 到 出 现 某 种 错误 条 件 ,那么 将 引 
起 异常 。 






































JMP、 CALL 
韭 一 致 代码 段 、 一 致 代码 段 
外 层 特权 级 RETF 、IRETD 
模 | 菲 一 致 代码 段 、 一 致 代码 成 | 村 
内 码 段 | 。 代码 段 块 块 
CALL | 中 断 异 常 | 人 四 人 B 
调用 门 0<m<n<3 JMP、 CALL 
中 断 门 / RETF IRETD 调用 门 
陷阱 门 
- INT、 中 Mi/ 异常 
内 层 特权 级 m 中 断 门 、 陷 阱 站 
9.36 任务 内 特权 级 变换 的 途径 图 9.37 任务 内 相同 特权 级 转移 的 途径 


9.9.2 特权 指令 

特权 指令 是 指 保护 方式 下 只 有 最 高 特权 级 才 可 以 执行 的 指令 ,也 即 只 有 当前 特权 级 CPL=0 
时 , 才 可 以 执行 的 指令 。 如 果 CPL 不 等 于 0 而 执行 这 些 指令 ,那么 会 引起 通用 保护 异常 。 
表 9.7 列 出 了 常见 的 特权 指令 。 备 注 栏 说 明 是 否 可 以 在 实 方式 下 执行 。 
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表 9.7 常见 的 特权 指令 





指 令 功 能 备注 
LGDT 装载 寄存 器 GDTR 实 方式 
LIDT 装载 寄存 器 IDTR 实 方式 
LLDT 装载 寄存 器 LDTR 
LTR 装载 寄存 器 TR 
MOV CRn, reg 装载 控制 寄存 器 实 方式 
MOV reg, CRn 获取 控制 寄存 器 实 方式 


从 表 9.7 可 知 , 特 权 指令 在 构成 完善 的 保护 机 制 方面 具有 重要 作用 。 

全 局 描述 符 表 GDT 和 中 断 描述 符 表 IDT 是 最 重要 的 系统 表 ,局 部 描述 符 表 LDT 和 任务 
状态 段 TSS 是 重要 的 系统 段 。 它 们 决定 了 各 个 任务 的 线性 地 址 空间 ,决定 了 各 个 存储 段 包括 
特权 级 在 内 的 属性 。 从 表 9. 7 可知, 只 有 特权 指令 才能 够 设置 系统 表 寄 存 器 (GDTR 和 
IDTR) 和 系统 段 寄存 器 (LDTR 和 TR) ,它们 完全 控制 了 全 局 描述 符 表 GDT 和 中 断 描 述 符 表 
IDT, 还 控制 了 任务 的 局 部 描述 符 表 LDT 和 任务 状态 段 TSS, 这 就 意味 着 只 有 最 内 层 的 代码 ， 
也 即 只 有 操作 系统 内 核 ,才能 够 管理 这 些 最 重要 的 系统 表 和 系统 段 。 

控制 寄存 器 是 最 重要 的 寄存 器 ,它们 决定 了 CPU 的 运行 方式 ,也 决定 了 线性 地 址 空间 到 
物理 地 址 空间 的 映射 。 从 表 9.7 可 知 ,只 有 特权 指令 才能 够 存 取 控 制 寄 存 器 ,也 即 只 有 操作 系 
统 内 核 代码 才能 够 使 用 控制 寄存 器 。 


习 题 


. 简要 说 明 逻 辑 地 址 空间 线性 地 址 空间 和 物理 地 址 空间 三 者 的 关系 。 
. 说 明 逻 辑 地 址 的 表示 形式 。 段 选择 子 与 段 值 有 何 区 别 ? 
. 逻辑 (虚拟 ) 地 址 空间 有 多 大 ? 给 出 计算 过 程 。 
. 简要 说 明 分 段 存储 管理 机 制 的 作用 。 
. 简要 说 明 分 页 存储 管理 机 制 的 作用 。 
. 简要 说 明 逻 辑 地 址 转换 成 物理 地 址 的 步骤 。 
. 系统 如 何 设置 4 个 特权 级 ? 哪 级 最 高 ? 哪 级 最 低 ? 
. 简要 说 明 4 个 特权 级 的 使 用 原则 。 
. 一 个 段 由 哪些 要 素 决定 ? 
10. 按 所 描述 对 象 分 类 ,有 哪 几 类 描述 符 ? 在 描述 符 数据 结构 中 的 体现 是 什么 ? 
11. 存储 段 的 长 度 最 大 可 达 多 少 ? 如 何 表示 ? 
12. 如 何 确定 数据 段 的 有 效 范围 ? 
13. 系统 中 全 局 描述 符 表 GDT、 局 部 描述 符 表 LDT 和 中 断 描述 符 表 IDT 各 有 几 张 ? 它 
们 之 间 有 什么 联系 ? 
14. 如 何 实现 某 个 段 被 两 个 任务 共享 ,但 又 不 被 第 三 个 任务 所 共享 ? 
15. 描述 符 表 的 最 大 有 效 段 界限 是 多 少 ? 为 什么 ? 
16. 段 描述 符 高 速 缓冲 存储 器 有 何 作用 ? 何 时 刷新 段 描述 符 高 速 缓冲 存储 器 ? 
17. 简要 说 明 由 逻辑 地 址 到 线性 地 址 的 具体 转换 过 程 。 
18. 有 哪些 存储 管理 寄存 器 ? 它们 的 作用 是 什么 ? 


oo 中 wo 王 
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19. 
20; 
2 
22. 
23. 

码 段 ? 
24. 
25. 
26. 
2 
28. 
29. 
30. 
3 
3 
33. 
34. 
35. 
36. 

么 要 求 ? 
37: 

与 不 同 ? 
38. 
39. 
40. 
41. 
42. 
43. 
44. 
45. 
46. 
47. 
48. 
49. 
50. 
5 


如 何 存 取 存 储 管理 寄存 器 ? 需要 注意 哪些 事项 ? 

如 何 存 取 控制 寄存 器 ? 需要 注意 哪些 事项 ? 

在 从 实 方式 切换 到 保护 方式 时 要 做 哪些 准备 工作 ? 

在 从 保护 方式 切换 到 实 方式 时 要 注意 什么 ? 

32 位 段 与 16 位 段 的 区 别 是 什么 ? 代码 段 描述 符 如 何 描述 32 位 代码 段 和 16 位 代 


别名 技术 是 指 什么 ? 

控制 寄存 器 CR2 和 CR3 分 别 有 什 么 作用 ? 

假设 页 尺寸 为 4KB, 简 要 说 明 由 线性 地 址 到 物理 地 址 的 具体 转换 过 程 。 

分 页 存储 管理 机 制 对 实现 虚拟 存储 器 有 何 支 持 ? 

分 页 存储 管理 机 制 如 何 支 持 页 的 保护 和 共享 ? 

有 哪些 门 描述 符 ? 这 些 门 描述 符 有 什么 作用 ? 

简要 说 明 任务 状态 段 TSS 的 作用 和 组 成 。 

符号 CPL、RPL、DPL 分 别 代表 什么 ? 它们 之 间 有 什么 联系 ? 

在 加 载 数 据 段 寄存 器 DS、.ES、FS 和 GS 时 ,对 CPL、RPL 和 DPL 有 什么 要 求 ? 
在 加 载 堆栈 段 寄存 器 SS 时 ,对 CPL、RPL 和 DPL 有 什么 要 求 ? 

非 一 致 代码 段 和 一 致 代码 段 有 什么 区 别 ? 一 致 代码 段 有 什么 用 途 ? 

在 给 定 最 终 转移 目标 地 址 时 ,有 哪些 不 同 的 方法 ? 这 些 方法 各 自 有 了 哪些 特点 ? 
简要 说 明 由 代码 段 A 主动 转移 到 代码 段 B 的 大 致 过 程 。 对 CPL、RPL 和 DPL 有 什 


采用 段 间 转移 指令 JMP 实现 转移 和 采用 段 间 调用 指令 CALL 实现 转移 ,有 什么 相同 


如 何 体现 特权 级 变换 ? 特权 级 变换 必须 满足 什么 条 件 ? 

特权 级 变换 时 为 什么 要 切换 堆栈 ? 如何 切 换 堆栈 ? 

如 何 体现 任务 切换 ? 

什么 时 候 发 生 任务 切换 ? 简 述 任务 切换 过 程 。 

哪些 情形 下 会 出 现任 务 嵌 套 ? 

中 断 和 异常 有 何 异 同 ? 

异常 分 为 哪 三 类 ? 各 自 有 什么 特点 ? 

列举 5 种 引起 通用 保护 故障 的 错误 条 件 。 

列举 3 种 引起 段 不 存在 故障 的 错误 条 件 。 

发 生 异 常 时 ,提供 错误 代码 有 何 意义 ? 说 明 错 误 代 码 的 一 般 格式 。 
在 发 生 中 断 或 异常 后 ,如 何 转 入 对 应 的 处 理 程序 ? 

为 支持 建立 多 任务 运行 环境 ,IA-32 系列 CPU 提供 了 哪些 保护 措施 ? 
特权 指令 的 特权 指 的 是 什么 ? 为 什么 要 有 特权 指令 ? 

在 示例 一 中 ,对 由 保护 方式 返回 到 实 方式 的 段 间 转移 指令 段 值 部 分 进行 了 重 定位 。 


为 什么 要 重 定位 ? 如 何 进行 重 定位 ? 


52. 


在 示例 二 中 ,有 两 条 段 间 转 移 指令 中 的 目标 地 址 没有 采用 入 口 标号 表示 偏 移 ,而 采用 


一 个 相对 值 表 示 偏 移 。 这 是 为 什么 ? 


53. 


在 示例 三 中 ,描述 视频 存储 区 段 的 描述 符 VideoMem 内 的 段 基地 址 和 段 限 有 什么 特 
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点 ? 这 样 安排 意味 着 什么 ? 


54. 


在 示例 四 中 ,假设 的 4MB 物理 内 存 被 分 为 1K 个 页 ,哪些 页 有 多 个 线性 页 与 之 对 应 ? 


哪些 页 没有 线性 页 与 之 对 应 ? 哪些 页 物理 地 址 等 于 线性 地 址 ? 为 什么 ? 


55. 


在 示例 五 中 ,在 把 指向 视频 存储 区 描述 符 的 选择 子 加 载 到 段 寄存 器 ES 时 ,为 什么 能 


够 通过 特权 级 检测 ? 


56. 
57. 


在 示例 六 中 ,假设 需要 把 演示 代码 的 特权 级 定 为 2 级 ,为 此 要 做 哪些 调整 ? 
在 示例 七 中 ,如 何 获 取 临 时 任务 的 挂 起 点 信息 ? 如 何 把 临时 任务 TSS 作为 数据 段 ? 


如 何 把 指示 该 数据 段 描 述 符 的 选择 子 装载 到 有 段 寄存 器 FS? 


58. 
59. 
60. 
61. 


在 示例 八 中 ,为 什么 要 安排 一 个 用 于 处 理 其 他 中 断 或 异常 的 处 理 程序 ? 

在 示例 九 中 ,有 意 引发 某 些 故障 并 加 以 处 理 ,是 否 可 以 有 其 他 引发 故障 的 方法 ? 
画 出 示例 五 示例 六 、 示 例 七 、 示 例 八 和 示例 九 的 内 存 映 像 示意 图 。 
实际 调试 各 示例 程序 。 








实验 工具 的 使 用 


本 书 使 用 的 实验 工具 包括 汇编 器 NASM 虚拟 机 管理 器 VirtualBox 和 模拟 器 Bochs, 本 
章 简要 介绍 这 些 工具 软件 的 使 用 。 同 时 ,简单 说 明 辅 助 工具 VHDWriter 的 使 用 。 


10.1 汇编 器 NASM 的 使 用 


本 节 简 单 介绍 在 Windows 平台 上 使 用 汇编 器 NASM。 为 利用 NASM 汇编 第 6 章 之 后 
的 示例 源 程序 或 读者 编写 的 汇编 源 程序 做 准备 。 关 于 NASM 的 详细 介绍 ,请 参阅 官方 使 用 
手册 。 


10.1.1 NASM 简介 


NASM 是 一 款 开 源 的 80x86 汇编 器 。 它 适用 BSD-2-Clause 开源 协议 。 

NASM 设计 的 初衷 就 是 要 开发 一 个 免费 的 且 比 MASM 等 收费 汇编 器 更 好 用 的 汇编 器 。 
它 的 语法 简洁 易 懂 ,不 仅 与 Intel 语法 相似 ,而 且 更 简单 。 它 支持 目前 已 知 的 所 有 IA-32 系列 
CPU 的 指令 ,同时 也 较 好 地 支持 宏 指令 。 它 支持 相当 多 的 目标 文件 格式 ,这 些 格式 覆盖 大 部 
分 操作 系统 。 它 本 身 可 以 运行 在 大 部 分 操作 系统 上 。 

NASM 不 是 编辑 器 ,只 是 汇编 器 。 为 了 编写 汇编 语言 源 程序 ,用 户 需要 使 用 其 他 软件 。 
但 是 ,NASM 提供 了 被 集成 方案 ,允许 Visual Studio 等 集成 开发 环境 调用 它 生成 目标 代码 。 

1. 获取 

获取 汇编 器 NASM 的 最 好 方法 是 访问 官方 网 站 http://www. nasm. us/。 从 该 网 址 可 以 
下 载 到 NASM 的 发 行 版 本 、 版 本 历史 说 明和 使 用 文档 等 。 

从 下 载 链接 进入 到 如 图 10. 1 所 示 的 下 载 页 面 ,该 页 面 给 出 了 一 个 目录 结构 。 第 一 层 目录 
按照 软件 的 版 本 区 分 ,数字 代表 的 是 版 本 号 ,后 级 rc 代表 了 候选 版 ,也 就 是 对 应 正式 版 之 前 的 
较为 稳定 的 版 本 ,rc 后 的 数字 代表 候选 版 的 版 本 号 。 截 至 本 书 编写 时 较 新 的 版 本 是 2. 12. 
02rcl ,也 就 是 2. 12. 02 版 的 第 一 个 候选 版 本 。 在 选择 一 个 版 本 后 ,进入 第 二 层 目 录 。 图 10. 2 
所 示 是 2. 12. 02rcl 版 的 目录 结构 ,其 中 含有 适用 于 多 种 操作 系统 环境 的 NASM 安装 包 或 者 
压缩 包 , 在 doc 项 下 还 有 多 种 不 同 格式 的 说 明文 档 。 

用 户 可 以 根据 需要 下 载 对 应 的 文件 。 例 如 ,假设 使 用 32 位 的 Windows 操作 系统 , 则 选择 
Win32 目录 下 载 文件 。 其 中 ,exe 格式 的 是 安装 版 ,zip 格式 的 是 压缩 版 。 两 者 本 质 上 没有 区 
别 ,实际 上 NASM 本 身 无 需 安装 即 可 使 用 。 

本 节 中 将 以 2. 12.01 的 32 位 Windows 版 为 例 进行 介绍 。 

2. 安装 

对 于 压缩 包 版 本 ,只 需 将 其 成 功 解压 就 代表 安装 完成 。 用 户 可 以 任意 指定 解压 位 置 。 可 








Index of /pub/nasm/releasebuilds 





Name Last modified Size Description 
Parent Directory 

国 21202rel 2016-04-05 13:47 

国 220v 2016-03-17 1726 


国 2120lry 2016-03-07 2226 
国 2120lrcy 2016-03-07 11:46 
2 2016-02-26 21:06 





图 10.1 下 载 NASM 主 目录 





Index of /pub/nasm/releasebuilds/2.12.02rc1 





Name Last modified Size Description 
4 Parent Directory 

dr 2016-04-05 13:45 

国 ds 2016-04-05 1347 - 

国 gtid 2016-04-05 1347 41 
[mL 2016-04-05 1347 

国 macox 2016-04-051347 - 





加 nasm-2.12.02rc1-xdoc tarbz2 2016-04-05 13:45 960K 
性 nasm-2.12.02rcl-xdoc tar gz 2016-04-05 13:45 1.1M 
ll nasm-2.12.02rcl-xdoc tarxz 2016-04-05 13:45 745K 





性 nasm-2.12.02rcl-xdoczip 2016-04-05 13:45 1.1M 
加 nasm-2.12.02rcltarbz2 2016-04-05 13:44 937K 
性 Dasm-2.12.02rcl tar gz 2016-04-05 13:44 12M 
国 masm-2.12. 02rcltarxz 2016-04-05 13:44 761K 
性 nasm-2.12.02rcl zp 2016-04-05 13:44 1.3M 
国 wn32 2016-04-05 13:47 

国 wn64/ 2016-04-05 13:47 
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图 10.2 下 载 NASM 子 目录 


以 认为 解压 的 目录 就 是 含有 汇编 器 NASM 的 目录 。 

下 面 简单 介绍 一 下 安装 版 的 安装 步骤 。 安 装 步骤 如 下 。 

(1) 运行 安装 程序 。 汇 编 器 NASM 适用 于 32 位 Windows 的 安装 版 文件 名 应 该 是 : 
nasm-2. 12. 01-installer-x86. exe。 双 击 下 载 的 该 安装 版 exe 文件 ,就 开始 安装 。 

(2) 选择 安装 内 容 。NASM 主 程序 是 必 选 的 ,还 可 以 选择 RDOFF (RDOFF 工具 集 )、 
Manual( 操 作 手 册 ) 和 VS8 intergration(VS2008 整合 文件 ) 。 

(3) 选择 安装 目录 。 用 户 可 以 根据 使 用 习惯 ,选择 安装 目录 。 

(4) 选择 是 否 创建 快捷 方式 。 如 果 选 择 创 建 快捷 方式 ,方便 打开 使 用 NASM 的 命令 行 
窗口 。 

如 果实 施 完整 安装 ,在 安装 成 功 后 会 有 多 个 文件 夹 和 文件 。 最 主要 的 是 汇编 器 NASM ， 
对 应 的 文件 名 是 nasm. exe。 男 外 ,还 有 一 个 ndinasm. exe, 它 是 反 汇编 器 ,利用 它 可 以 将 一 个 
由 nasm 生成 的 可 执行 程序 反 汇 编 成 源 代码 。 
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10.1.2 NASM 的 使 用 


1. 命令 行 窗口 

通常 把 汇编 器 NASM 作为 一 个 命令 行 工具 使 用 。 为 了 在 Windows 平台 上 使 用 它 ,需要 
先进 入 Windows 的 命令 行 窗口 。 下 面 简单 介绍 进入 Windows 命令 行 窗口 的 方法 。 

(1) 从 文件 夹 进入 。 对 于 不 熟悉 命令 行 窗口 的 用 户 , 从 文件 夹 直接 进入 命令 行 窗 口 比较 
简单 。 操 作 步 又 如 下 : 打开 汇编 器 NASM 对 应 文件 nasm. exe 所 在 的 文件 夹 ; 按 住 Shift 键 
的 同时 ,在 文件 列表 空白 区 域 右 击 ; 在 如 图 10. 3 所 示 的 弹出 的 下 拉 菜 单 中 选择 “在 此 处 打开 
命令 窗口 (W)”, 随 即 出 现 如 图 10. 4 所 示 的 命令 行 窗口 。 





























查看 (V) > 
排序 方式 (O) > 
分 组 依据 (P) 
刷新 (日 

粘贴 (P) 

粘贴 快捷 方式 (5 

共享 (H) > 
新 建 (W) 学 
属性 (R) 

10.3 选择 打开 命令 行 窗 口 10.4 命令 行 窗口 


(2) 通过 开始 菜单 进入 。 如 果 使 用 安装 版 安装 而 不 是 压缩 包 解压 ,并 且 在 安装 的 最 后 一 
步 选择 了 创建 开始 菜单 快捷 方式 , 则 在 开始 菜单 中 ,直接 运行 nasm-shell 即 可 快速 打开 命令 行 
窗口 。 

通过 上 述 两 种 方法 ,都 能 打开 命令 行 窗 口 ,同时 命令 行 提示 所 在 工作 目录 就 是 NASM 所 
在 的 文件 夹 。 如 果 通 过 其 他 方法 打开 了 命令 行 窗口 ,需要 将 工作 目录 切换 到 NASM 所 在 文件 
夹 才 能 运行 NASM 命令 ,否则 会 提示 错误 。 

2. 命令 行 选项 

在 命令 行 窗口 中 ,如 果 当 前 工作 目录 就 是 NASM 所 在 的 文件 夹 ,那么 可 以 直接 运行 
NASM 命令 。 汇 编 器 NASM 命令 的 基本 使 用 格式 如 下 : 


NSW 源 文件 [-f 格 式 ] [-o 输 出 文件 ] [-1 列 表 文 件 ] 


其 中 ,“ 源 文件 ”指定 被 汇编 的 源 程序 文件 ,应 该 包含 扩展 名 ;“ 格 式 " 指 定 生成 的 目标 文件 
格式 ;“ 输 出 文件 ”指定 生成 的 目标 文件 ;“ 列 表 文件 ”指定 含有 汇编 信息 的 列表 文件 。 方 括号 
表示 该 选项 可 以 缺 省 。 

汇编 器 NASM 命令 的 选项 以 减 号 (一 ) 引 导 ,选项 符 与 随后 的 参数 之 间 可 以 有 空格 作为 分 
隔 符 , 也 可 以 没有 分 隔 符 。 

(1) 格式 (Format) 选 项 (一 f)。 该 选项 用 于 指定 NASM 汇编 输出 目标 文件 的 格式 。 如 果 
不 设置 ,默认 采用 bin 格式 。 汇 编 器 NASM 支持 的 几 种 常用 输出 格式 如 下 。 

Q@ bin: 纯 二 进 制 目标 代码 文件 ,不 依赖 操作 系统 。 


新 概念 汇编 语言 





@ obj: 微软 OMF 目标 文件 ,用 于 供给 16 位 DOS 链接 器 生成 exe 文件 。 

@ win32: 微软 Win32 目标 文件 ,主要 用 于 VC++ 生 成 exe 文件 。 

@ coff: 通用 目标 文件 。 

@ elf: 可 执行 可 链接 格式 目标 文件 ,主要 在 Linux 和 UNIX 系统 中 使 用 。 

@ rdf: 可 重 定位 的 动态 目标 文件 ,也 即 RDOFF 格式 目标 文件 ,属于 NASM 自己 特有 的 
格式 文件 。 

(2) 输出 文件 (Outfile) 选 项 (一 o)。 该 选项 用 于 指定 生成 的 目标 文件 ,可 以 带 上 扩展 名 。 
如 果 不 设置 ,NASM 将 根据 源 文件 名 来 形成 对 应 的 输出 文件 名 ,而 扩展 名 与 设置 的 输出 目标 
文件 格式 有 关 。 

(3) 列表 文件 (Listfile) 选 项 (一 1) 。 该 选项 用 于 指定 产生 列表 文件 。 在 列表 文件 中 ,在 左 
边 列 出 对 应 指令 的 偏 移 地 址 和 机 器 码 ,在 右边 列 出 实际 的 源 代码 (包括 展开 的 宏 指令 )。 通 过 
列表 文件 ,可 以 清楚 地 看 到 指令 与 机 器 码 的 关系 ,也 可 以 清楚 地 看 到 伪 指 令 定义 数据 的 情况 。 

除了 上 述 介绍 的 几 个 重要 选项 外 ,汇编 器 NASM 还 有 多 个 其 他 的 使 用 选项 。 在 命令 行 窗 
口中 ,通过 以 下 带 选项 -h 的 命令 ,能 够 获得 简单 的 NASM 使 用 帮助 信息 。 


MM =- h 


3. 使 用 实例 
下 面 举例 说 明 在 命令 行 窗口 中 使 用 汇编 器 NASM。 
【 例 10-1】 将 汇编 源 程序 myfile. asm 汇编 生成 纯 二 进 制 目标 代码 。 汇 编 命令 如 下 : 


nasm nyfile.asm— f bin -ormyfile .co 


上 述 汇编 命令 中 ,指定 了 输出 目标 文件 的 格式 bin, 还 明确 指定 了 输出 目标 文件 的 文件 名 
myfile. com。 在 本 书 中 主要 采用 上 述 形式 的 汇编 命令 ,由 汇编 源 程序 文件 得 到 纯 二 进 制 目标 
代码 文件 。 

【 例 10-2】 将 汇编 源 程序 myfile. asm 汇编 生成 纯 二 进 制 目标 代码 ,并 生成 列表 文件 。 汇 
编 命令 如 下 : 

nasm myfile.asm ~ fbin - ayfile - Imyfile. lst 


上 述 汇编 命令 中 ,指定 了 输出 文件 ,有 意 没有 使 用 扩展 名 ; 要 求生 成 列表 文件 ,并 指定 列 
表 文 件 名 myfile. lst。 在 选项 符 和 参数 之 间 ,省 略 了 分 隔 符 。 

【 例 10-3】 将 汇编 源 程序 hello. asm 汇编 生成 纯 二 进 制 目标 代码 文件 hello。 汇 编 命令 
如 下 : 


nasm helloasm 一 ohello 
上 述 汇编 命令 缺 省 格式 选项 符 (一 f) ,表示 输出 纯 二 进 制 代 码 。 
【 例 10-4】 将 汇编 源 程序 myfile. asm 汇编 生成 obj 格式 的 目标 代码 。 汇 编 命 令 如 下 : 


nasm nyfile.asm—f obj- oanf.obj 


上 述 汇编 命令 中 ,指定 输出 文件 的 格式 为 obj. 输 出 文件 名 为 myf. obj。 在 通过 汇编 得 到 
目标 文件 myf. obj 之 后 ,可 以 利用 链接 器 生成 exe 类 型 的 可 执行 程序 。 
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以 下 汇编 命令 可 以 同时 生成 列表 文件 myfl: 
nasm myfile asm -fobi ayf cbj — Imwfl 
4. 常见 出 错 提示 信息 
在 汇编 过 程 中 ,如 果 源 程序 中 的 指令 有 错误 ,或 者 表达 式 有 错误 ,或 者 源 程序 格式 不 符合 


规范 ,那么 汇编 器 NASM 将 发 出 提示 信息 。 下 面 举例 说 明 常见 的 出 错 提示 信息 。 
【 例 10-5】 设 有 如 下 带 有 错误 的 源 程序 test asm, 以 注释 的 形式 标 出 了 行 号 。 


| 
. 


org 100H 


到 各 亏 豆 豆 豆 豆 
至 只 
中 也 
B85 


在 汇编 过 程 中 ,汇编 器 NASM 会 给 出 如 下 提示 信息 。 
test. asm:1: error: parser: instruction expected 
test. asm:3: error: coma，colon or end of |ine expected 
test asm:8: error: ooma, colon or end of |ine expected 
结合 出 错 提示 信息 和 检查 源 程序 ,可 以 发 现 : 第 1 行 有 拼写 错误 ,应 该 是 “segment”; 第 3 
行 的 注释 应 该 以 西 文 的 分 号 引导 ,而 非 纯 中 文 的 分 号 ; 第 8 行 的 两 个 操作 数 之 间 缺 少 了 逗号 ， 
助 记 符 也 不 正确 。 修 改 纠正 后 的 源 程序 如 下 : 


segment text EL 
org 100H 2 
MV MC 3 
MV DS A 4 
MOV DX hello 5 
MV 用 %+ 2 0 
IN 2IH Ha 
Wy M4H 8 
INT 2IH bd 


青 次 汇编 ,在 汇编 过 程 中 ,汇编 器 NASM 会 给 出 如 下 提示 信息 。 
test. asm:4: error: invalid cobination of opcode and operands 
test. asm:5: error: syrbol 'hello' undefined 
test. asm:6: warning: byte value exceeds bounds 
test. asm:7: error: invalid cambination of opcode and operands 
结合 出 错 提示 信息 和 检查 源 程序 ,可 以 发 现 : 第 4 行 操作 数 尺寸 不 一 致 ; 第 5 行 没有 定义 
标号 hello; 第 7 行 的 指令 助 记 符 有 误 ,应 该 是 *INT” ,被 误解 为 输入 指令 IN, 这 样 就 缺少 另 一 
个 操作 数 。 还 可 以 发 现 ,第 6 行 试图 把 259 传送 给 AH, 这 超过 8 位 数 的 上 限 , 但 这 是 可 以 的 ， 
所 以 汇编 器 发 出 警告 信息 ,而 非 出 错 提示 信息 。 


新 概念 汇编 语言 





一 般 情 况 下 ,根据 出 错 提示 信息 或 者 警告 信息 中 的 行 号 ,仔细 检查 源 程 序 中 对 应 行 的 代 
码 ,就 可 以 发 现 错误 所 在 。 


10.1.3 链接 器 及 其 使 用 


为 了 生成 纯 二 进 制 目标 代码 文件 , 源 程序 只 能 由 一 个 段 构成 ,并 且 不 能 根据 需要 指定 开始 
执行 的 位 置 。 从 第 6 章 开始 的 大 多 数 演示 程序 都 是 如 此 。 当 源 程序 包含 有 多 个 段 , 如 果 仍 希 
望 生成 纯 二 进 制 目标 代码 文件 ,那么 汇编 器 NASM 会 提示 出 错 。 

为 了 把 含有 多 个 段 的 源 程序 转换 成 可 执行 文件 (程序 ) ,需要 先 汇编 ,再 链接 ,也 即 把 源 程 
序 汇编 成 目标 代码 文件 ,然后 再 链接 成 可 执行 文件 。 同 时 注意 ,在 所 有 段 中 有 且 只 有 一 个 段 含 
有 开始 执行 的 位 置 。 一 种 可 行 的 操作 步骤 如 下 。 

(1) 使 用 汇编 器 NASM, 生 成 obj 格式 的 目标 文件 。 

(2) 使 用 链接 器 ,将 obj 目标 文件 链接 成 可 执行 文件 。 

链接 器 的 作用 ,是 将 一 个 或 多 个 由 编译 器 或 汇编 器 生成 的 目标 文件 ,还 有 外 加 的 库 文件 
等 ,链接 到 一 起 形成 一 个 可 执行 文件 。 

链接 器 软件 并 不 唯一 ,本 书 所 使 用 的 链接 器 LINK(Microsoft 8086 Object Linker) 是 一 个 
很 早 且 简 单 的 链接 器 。 

链接 器 LINK 命令 的 简单 使 用 格式 如 下 : 


lirk 目标 文件 .obj ; 


【 例 10-6】 将 第 6 章 中 的 源 程序 dp66. asm 生成 为 exe 格式 可 执行 文件 。 操 作 步 又 
如 下 : 
(1) 使 用 NASM 生成 obj 格式 文件 : 


nasn dbb am- fobj 
(2) 使 用 链接 器 生成 exe 文件 : 
lirk dbocbj ; 
正确 执行 上 述 操作 后 ,在 目录 中 会 生成 可 执行 程序 dp66. exe 文件 。 随 后 ,可 以 在 命令 行 
窗口 中 运行 它 。 


10.2 虚拟 机 管理 器 VirtualBox 的 使 用 


本 节 简 单 介 绍 在 Windows 平台 上 使 用 虚拟 机 管理 器 VirtualBox。 利 用 VirtualBox 创建 
的 虚拟 机 ,能 够 运行 7.4 节 介 绍 的 加 载 器 ,从 而 建立 运行 第 8 章 和 第 9 章 示 例 程序 的 环境 。 在 
这 个 环境 中 ,也 可 以 运行 由 读者 自己 编写 的 源 程 序 生成 的 纯 二 进 制 目标 代码 。 


10.2.1 VirtualBox 简介 


VirtualBox 是 一 款 开 源 的 虚拟 机 软件 。 最初 由 德国 Innotek 公司 开发 , 由 Sun 
Microsystems 公司 出 品 ,在 Sun 公司 被 Oracle 公司 收购 后 ,正式 更 名 为 Oracle VM 
VirtualBox。 现 在 由 Oracle 公司 开发 ,是 Oracle 公司 xVM 虚拟 化 平台 技术 的 一 部 分 。 
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VirtualBox 最 初 是 以 专 有 软件 协议 的 方式 提供 ,后 来 Innotek 公司 以 GNU 通用 公共 许可 证 
CGPL) 释 出 VirtualBox 而 成 为 自由 软件 ,并 提供 二 进 制版 本 及 开放 源 代码 版 本 的 代码 。 

VirtualBox 号 称 是 最 强 的 免费 虚拟 机 软件 。 它 不 仅 具 有 丰富 的 特色 ,而且 性 能 也 很 优异 。 
它 提供 用 户 在 32 位 或 64 位 的 Windows、Linux 及 Solaris 操作 系统 上 虚拟 其 他 x86 的 操作 系 
统 。 用 户 可 以 在 VirtualBox 上 安装 并 且 运 行 Solaris、Windows、DOS、Linux 等 系统 作为 客户 
机 操作 系统 。 

VirtualBox 作为 虚拟 机 管理 器 ,使 用 比较 方便 。VirtulBox 能 够 创建 和 管理 多 台 虚 拟 机 。 
在 这 些 虚拟 机 上 ,能 够 分 别 安装 不 同 的 客户 机 操作 系统 。 每 个 客户 机 系统 都 能 够 独立 运行 ,就 
像 不 同 的 机 器 ,可 以 独立 地 打开 、 暂 停 与 停止 。 宿 主机 操作 系统 与 客户 机 操作 系统 之 间 能 相互 
通信 ,而 且 还 能 够 同时 使 用 网 络 。 

在 VirtualBox 创建 的 虚拟 机 上 ,可 以 不 安装 操作 系统 ,直接 引导 和 执行 特定 的 程序 。 利 
用 这 一 特点 ,可 以 在 虚拟 机 上 直接 运行 纯 目标 代码 。 采 用 这 种 方式 运行 程序 ,优点 是 可 以 不 受 
操作 系统 的 约束 ,“ 为 所 欲 为 ”; 缺点 是 没有 操作 系统 可 以 依靠 ,除了 利用 BIOS 外 ,其 他 都 必须 
“自力 更 生 ”。 

1. 获取 

从 www. virtualbox. org 可 以 下 载 得 到 VirtualBox 软件 。 由 于 要 在 Windows 平台 上 运 
行 ,因此 应 该 下 载 以 Windows 为 宿主 机 操作 系统 的 VirtualBox 版 本 安装 程序 。 从 下 载 文 件 
的 文件 名 中 ,可 以 发 现 对 应 操作 系统 的 标记 。 截 至 本 书 编写 时 较 新 的 版 本 为 5. 1。 

2. 安装 

安装 VirtualBox 的 过 程 比较 简单 。 直 接 运 行 下 载 的 安装 程序 ,就 可 以 完成 安装 。 这 里 采 
用 5.0.4 版 进行 介绍 ,其 他 版 本 安装 过 程 与 之 基本 一 致 。 

启动 安装 程序 后 的 第 一 个 界面 如 图 10. 5 所 示 。 


Welcome to the Oracle VM 
VirtualBox 5.0.4 Setup Wizard 


The Setup Wizard will install Orade VM VirtualBox 5.0.4 on 
your computer. Click Next to continue or Cancel to exit the 
Setup Wizard. 





Version 5.0.4 Next > Cancel 


图 10.5 VirtualBox 安装 程序 启动 











接 下 来 是 选择 安装 的 内 容 和 安装 的 位 置 。 如 果 没 有 特别 需要 ,并且 磁盘 有 足够 的 空间 , 那 
就 可 以 简单 地 采用 默认 的 选项 。 

安装 过 程 中 可 能 对 网 络 连接 有 所 影响 。 但 在 安装 之 后 一 般 并 不 会 对 网 络 产生 影响 ,所 以 
仍 可 继续 安装 。 

随即 出 现 安装 确认 界面 。 在 确认 安装 之 后 ,实施 自动 安装 。 整 个 过 程 比较 快 。 最 后 出 现 
如 图 10. 6 所 示 的 安装 成 功 确认 界面 。 








Oracle VM VirtualBox 5.0.4 
installation is complete. 


Click the Finish button to exit the Setup Wizard. 


| Start Orade VM VirtualBox 5.0.4 after installation 


Version 5.0.4 < Back Cancel 









图 10.6 VirtualBox 安装 完成 


10.2.2 VirtualBox 的 使 用 


1. VirtualBox 管理 器 的 运行 

在 安装 成 功 之 后 ,就 可 以 像 其 他 软件 一 样 ,通过 启动 菜单 或 者 快捷 图 标 ,开始 运行 虚拟 机 
管理 器 VirtualBox。 

图 10.7 所 示 是 尚未 创建 虚拟 机 ,运行 VirtualBox 的 情形 。 图 10. 8 所 示 是 已 具备 一 台 虚 
拟 机 的 情形 ,这 台 虚 拟 机 的 名 称 是 VM_ASM。 
Oadle VM VitualBon SE 2 2 aE 


管理 (F) 控制 (M) 帮助 (H) 





癌 沁 区 国 各 份 [系统 快 限 ](S) 
新 建 (N) a(s) 消除 启动 (D)- Es 


^ | 欢迎 使 用 虚拟 电脑 控制 台 ! 

万 | 现在 是 空 的 ， 因 
为 你 还 没有 新 建 任何 虚报 电 ee 
要 新 建 一 个 虚拟 电脑 ， 人 Se 
顶部 工具 栏 上 的 新 建 按 
你 可 以 技 Fl 键 来 查看 帮助 ， 或 访问 < 
waw. virtualbox. org 查看 最 新 信息 > 
和 新 闻 . 

















图 10.7 尚未 创建 虚拟 机 
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图 10.8 具备 一 台 虚 拟 机 


2. 虚拟 机 的 创建 

VirtualBox 作为 虚拟 机 管理 器 ,用 户 利用 它 能 够 方便 地 创建 虚拟 机 。 

运行 VirtualBox ,出 现 如 图 10.7 或 图 10. 8 所 示 界 面 后 , 按 位 于 左上 方 的 “新 建 " 图 标 , 就 
开始 创建 虚拟 机 。 创 建 虚拟 机 的 界面 如 图 10.9 所 示 。 创 建 虚拟 机 的 主要 工作 包括 指定 虚拟 
机 名 称 、 设 定 虚拟 机 内 存 容量 \ 设 定 虚拟 机 的 虚拟 硬盘 。 























内 存 大 小 (WD 
人 
4 JJB 


虚拟 硬盘 

图 不 添加 产 拟 硬盘 (D) 

图 现在 创建 虚拟 硬盘 (C) 

@ 使 用 已 有 的 虚拟 硬盘 文件 (U) 
没有 盘 片 











[外 S 术 式 @] [他 建 ] [取消 


10.9 创建 虚拟 机 


(1) 指定 虚拟 机 的 名 称 , 给 出 准备 在 虚拟 机 上 安装 的 操作 系统 版 本 信息 。 
用 户 可 以 根据 喜好 或 者 用 途 , 指 定 虚拟 机 的 名 称 。 该 名 称 作为 虚拟 机 的 标识 , VirtualBox 
将 据 此 管理 和 识别 虚拟 机 。 
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由 操作 系统 的 类 型 和 版 本 信息 说 明 准备 在 该 虚拟 机 上 安装 和 运行 的 操作 系统 。 
VirtualBox 将 利用 这 些 信息 准备 当前 创建 的 虚拟 机 所 默认 ( 缺 省 ) 的 其 他 配置 参数 ,但 是 这 并 
非 为 虚拟 机 安装 指定 的 操作 系统 。 如 果 用 户 并 不 打算 在 虚拟 机 上 安装 操作 系统 ,仅仅 打算 在 
虚拟 机 上 运行 纯 目标 代码 ,建议 按 图 10. 9 所 示 选 择 操作 系统 类 型 和 版 本 。 为 运行 第 8 章 和 第 
9 章 的 示例 程序 ,不 需要 安装 操作 系统 。 

(2) 设 定 虚拟 机 的 内 存 容 量 。 如 图 10. 9 所 示 ,用户 可 以 根据 宿主 机 的 物理 内 存 大 小 和 虚 
拟 机 的 用 途 等 , 设 定 当 前 创建 虚拟 机 的 内 存 容 量 。 如 果 只 是 为 了 运行 第 8 章 和 第 9 章 的 示例 
程序 ,虚拟 机 不 需要 较 大 的 内 容 容 量 。 

(3) 设 定 虚拟 机 的 虚拟 硬盘 。 虚 拟 硬盘 是 由 文件 来 模拟 的 , 它 本 质 上 是 宿主 机 上 的 一 个 
磁盘 文件 。 如 果 没 有 特别 要 求 ,或 者 说 不 存在 特定 的 虚拟 磁盘 文件 ,那么 可 以 通过 创建 的 方式 
来 生成 虚拟 硬盘 。 如 图 10. 9 所 示 ,选择 “现在 创建 虚拟 硬盘 ”。 然 后 ,轻松 地 按 下 “创建 "按钮 ， 
来 创建 虚拟 硬盘 。 创 建 虚拟 硬盘 的 界面 如 图 10. 10 所 示 。 创 建 虚拟 硬盘 的 工作 包括 设 定 虚 拟 
硬盘 文件 的 存放 位 置 、 设 定 文件 大 小 (虚拟 硬盘 的 大 小 ) 、 选 择 虚拟 硬盘 文件 的 类 型 .确定 空间 
分 配方 式 。 


文件 位 置 (D 
F: \NASM\VM_ASY. vhd 





文件 大 小 (9) 


rt ， 引 ， 

4.00 MB 2.00 TB 

虚拟 硬盘 文件 类 型 (D) 存储 在 物理 硬盘 上 

加 VDI (VirtualBox 磁盘 映像 ) 同 动态 分 配 (D) 

园 VMDK (虚拟 机 磁盘 ) 图 固定 大 小 (FE) 

圈 VHD (虚拟 硬盘 ) 问 分 割 为 26B 以 下 大 小 的 文件 (S) 
网 HDD (并 口 硬盘 ) 

@ QED (QEMU 增强 型 磁盘 ) 

@ QcoW (QEMU 写 入 时 复制 ) 








如 图 10. 10 所 示 , 用 户 可 以 指定 代表 虚拟 硬盘 的 文件 的 文件 名 ,但 是 扩展 名 与 文件 类 型 有 
关 。 按 右上 方 的 文件 夹 图 标 ,用 户 可 以 选择 虚拟 硬盘 文件 所 在 的 文件 夹 。 如 果 为 了 运行 第 8 
章 和 第 9 章 的 示例 程序 ,建议 选择 汇编 器 NASM 所 在 的 工作 文件 夹 。 

如 图 10. 10 所 示 , 用 户 可 以 设 定 虚拟 硬盘 文件 的 大 小 ,文件 的 大 小 决定 了 所 代表 的 虚拟 硬 
盘 的 大 小 。 如 果 只 是 为 了 运行 第 8 章 和 第 9 章 的 示例 程序 ,虚拟 硬盘 文件 不 需要 太 大 。 

模拟 硬盘 的 文件 有 多 种 不 同 的 格式 ,实际 上 不 同 的 厂商 制定 了 不 同 的 标准 。VHD 是 微 
软 虚拟 硬盘 (Virtual Hard Disk) 文 件 的 简称 , 它 的 格式 比较 简单 ,文件 中 只 有 最 后 512 字 节 
(一 个 扇 区 ) 含 有 虚拟 硬盘 的 描述 信息 ,文件 的 其 他 部 分 依次 对 应 被 模拟 硬盘 的 扇 区 。 简 单 起 
见 , 选 择 *VHD( 虚 拟 硬盘 )”, 如 图 10. 10 所 示 , 这 样 可 以 方便 地 利用 10. 4 节 介 绍 的 工具 
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VHDWriter 把 纯 二 进 制 目标 代码 写 到 虚拟 硬盘 文件 。 

由 于 虚拟 硬盘 文件 不 需要 太 大 ,简单 起 见 , 选 择 * 固 定 大 小 ”。 

最 后 单 击 “ 创 建 ”按钮 ,不 仅 完 成 了 虚拟 硬盘 的 创建 ,同时 也 完成 了 虚拟 机 的 创建 。 这 时 可 
得 到 如 图 10. 8 所 示 的 界面 。 

3. 虚拟 机 的 启动 

在 成 功 创建 虚拟 机 后 , 便 可 以 启动 虚拟 机 的 运行 。 如 图 10. 8 所 示 界 面 ,既是 创建 虚拟 机 
完成 之 后 的 界面 ,往往 也 是 运行 VirtualBox 的 开始 界面 。 

在 选择 指定 的 虚拟 机 后 , 单 击 * 启 动 ”图 标 , 便 * 正 常 启 动 " 所 指定 的 虚拟 机 。 就 像 实验 室 有 

台 计 算 机 , 按 下 某 台 计算 机 的 电源 开关 ,就 启动 该 台 计算 机 。 

类 似 地 ,虚拟 机 会 尝试 从 虚拟 硬盘 上 引导 操作 系统 。 如 果 仅 仅 通过 上 述 步 骤 创 建 了 虚拟 
机 ,但 并 没有 为 虚拟 机 安装 操作 系统 ,也 没有 向 代表 虚拟 硬盘 的 文件 中 写 入 引导 代码 ,那么 启 
动 虚拟 机 就 像 启 动 没有 安装 操作 系统 的 计算 机 。 

为 了 运行 由 汇编 器 生成 的 纯 目标 代码 ,应 该 利用 其 他 工具 把 纯 二 进 制 目标 代码 写 人 虚拟 
硬盘 文件 的 指定 位 置 。 一 般 情况 下 ,至 少 应 该 向 虚拟 硬盘 文件 写 入 引导 程序 (加 载 器 )。 在 
10.4 节 将 介绍 如 何 使 用 VHDWriter 工具 写 虚拟 硬盘 文件 。 

4. 虚拟 机 的 关闭 

为 了 关闭 虚拟 机 ,可 以 直接 关闭 如 图 10. 11 所 示 的 虚拟 机 运行 窗口 ,也 可 以 由 虚拟 机 “ 管 
理 ” 菜 单 中 的 “退出 ”项 来 关闭 虚拟 机 。 这 时 ,将 出 现 选择 关闭 方式 的 菜单 。 通 常情 况 下 ,应 该 
选择 “正常 关闭 ”。 在 调试 本 书 示 例 程序 时 ,因为 没有 操作 系统 环境 ,可 以 选择 “强制 退出 ”关闭 
虚拟 机 。 

注意 ,关闭 虚拟 机 并 不 会 关闭 虚拟 机 管理 器 VirtualBox。 关 闭 虚拟 机 管理 器 也 不 会 关闭 
正在 运行 的 虚拟 机 。 

5. 使 用 实例 

下 面 举例 说 明 虚 拟 机 管理 器 和 虚拟 机 的 使 用 。 假 设 已 经 了 解 10. 4 节 介 绍 的 工具 
VHDWriter 及 其 使 用 。 

【 例 10-7】 利用 虚拟 机 管理 器 VirtualBox 及 其 虚拟 机 VM_ASM, 运 行 7. 3 节 示 例 程序 
dp74. asm 的 纯 二 进 制 目标 代码 hello。 

假设 已 经 如 上 所 述 创建 虚拟 机 VM_ASM, 并 且 其 对 应 的 虚拟 硬盘 文件 为 VM_ASM. 
vhd。 那 么 ,操作 步骤 如 下 。 

(1) 利用 工具 VHDWriter, 把 7. 3 节 示 例 程 序 dp74. asm 的 纯 二 进 制 目标 代码 , 写 到 虚拟 
硬盘 文件 VM_ASM. vhd 的 0 扇 区 (引导 扇 区 ) 。 

(2) 运行 虚拟 机 管理 器 VirtualBox。 

(3) 启动 虚拟 机 VM_ASM。 

图 10. 11 所 示 是 虚拟 机 VM_ASM 的 运行 窗口 。 在 启动 虚拟 机 VM_ASM 后 , 它 从 虚拟 
硬盘 读 入 主 引 导 记 录 , 并 执行 。 从 dp74. asm 可 知 ,这 个 名 义 上 的 引导 程序 其 实 没有 引导 功 
能 ,在 显示 hello 信息 后 便 进入 无 限 循环 。 

【 例 10-8〗 利用 虚拟 机 VM_ASM., 运 行 7.4 节 示例 程序 dp78. asm 的 纯 二 进 制 目标 
代码 。 

假设 已 经 如 上 所 述 在 VirtualBox 中 创建 虚拟 机 VM_ASM, 并 且 其 对 应 的 虚拟 硬盘 文件 
为 VM_ASM. vhd。 那 么 ,操作 步骤 如 下 。 
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图 10.11 由 虚拟 机 加 载运 行 hello 程序 的 结果 

(1) 利用 工具 VHDWriter, 把 7.4 节 的 加 载 器 dp77. asm 的 纯 二 进 制 目标 代码 loader, 写 
到 虚拟 硬盘 文件 VM_ASM. vhd 的 0 扇 区 (引导 扇 区 )。 如 果 引 导 扇 区 已 经 含有 这 个 加 载 器 ， 
可 以 跳 过 该 步 。 


(2) 利用 工具 VHDWriter, 把 示例 程序 dp78 的 纯 二 进 制 目标 代码 , 写 到 虚拟 硬盘 文件 
VM_ASM. vhd。 假 设 从 第 nn 扇 区 开始 存放 。 这 里 假设 是 168。 需 要 注意 的 是 ,避免 覆盖 在 
0 扇 区 的 引导 程序 ,或 者 已 经 存在 的 其 他 目标 代码 。 如 果 在 虚拟 硬盘 文件 中 已 经 存在 需要 运 
行 的 目标 代码 ,可 以 跳 过 该 步 。 

(3) 运行 虚拟 机 管理 器 VirtualBox。 
(4) 启动 虚拟 机 VM_ASM。 
运行 结果 如 图 10. 12 所 示 。 在 启动 虚拟 机 VM_ASM 后 , 它 从 虚拟 硬盘 读 入 主 引 导 记 录 ， 

并 执行 。 从 dp77. asm 可 知 , 这 个 引导 程序 具有 引导 加 载 的 功能 , 它 发 出 “Input sector 

address: “的 提示 信息 。 在 用 户 输入 希望 被 加 载 的 目标 代码 的 起 始 扇 区 号 后 ,将 加 载 指定 的 目 


标 代码 。 从 dp78. asm 可 知 , 它 仅仅 显示 一 条 地 址 信息 。 之 后 ,又 回 到 了 加 载 器 (引导 程序 )， 
它 发 出 引导 加 载 其 他 目标 代码 的 提示 信息 。 
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图 10.12 虚拟 机 引导 程序 加 载运 行 某 个 程序 的 运行 结果 


10.2.3 关于 硬件 加 速 


VirtualBox 在 运行 虚拟 机 时 ,利用 宿主 机 的 CPU 执行 指令 。 早 期 虚拟 机 是 通过 纯 软 件 模 
拟 来 实现 虚拟 机 功能 ,后 来 以 Intel 和 AMD 为 代表 的 CPU 生产 商 各 自 推出 了 CPU 虚拟 化 技 
术 , 以 Windows 和 Linux 为 代表 的 操作 系统 推出 了 虚拟 化 解决 方案 ,这 些 技术 都 使 得 虚拟 机 
运行 准确 性 和 效率 得 到 了 提高 。VirtualBox 现在 除了 使 用 自身 的 软件 虚拟 化 技术 ,还 可 以 利 
用 CPU 虚拟 化 技术 和 操作 系统 提供 的 虚拟 化 技术 提高 VirtualBox 虚拟 机 运行 效率 。 
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如 果 需 要 手动 设置 虚拟 化 功能 ,可 以 按 下 列 步骤 实现 。 

(1) 选中 需要 修改 的 虚拟 机 。 只 需 选中 ,不 需要 启动 虚拟 机 。 

(2) 打开 设置 。 在 主 界面 中 , 单 击 “设置 按钮 ,打开 如 图 10. 13 所 示 的 设置 窗口 。 选 择 设 
置 中 左 侧 菜 单 中 的 “系统 ”选项 ,在 右 侧 会 显示 系统 设置 界面 。 将 系统 设置 界面 中 的 标签 从 “ 主 
板 ” 切 换 到 “硬件 加 速 ”。 

(3) 修改 相关 参数 。 硬 件 加 速 可 以 修改 的 参数 有 两 类 : 一 类 是 半 虚 拟 化 接口 ; 另 一 类 是 
硬件 虚拟 。 如 果 宿 主机 操作 系统 支持 虚拟 化 技术 ,可 以 在 半 虚 拟 化 接口 选项 中 选择 对 应 参数 。 
例如 ,Linux 操作 系统 可 以 直接 指定 KVM; 如 果 不 想 使 用 半 虚 拟 化 接口 , 则 直接 选 无 。 硬 件 
虚拟 包括 “启用 VT-x/AMD-V” 和 “启用 谤 套 分 页 ”两 个 选项 开关 ,这 两 个 选项 都 与 CPU 的 虚 
拟 化 有 关 , 打 勾 代表 尝试 在 虚拟 机 中 启用 ,不 选 则 关闭 该 功能 。 





系统 
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图 10.13 ”硬件 加 速配 置 选 项 


默认 情况 下 ,使 用 VirtualBox 创建 虚拟 机 时 ,硬件 加 速 会 自动 配置 。 通 常 ,自动 配置 的 参 
数 能 够 正常 运行 , 且 提 高 虚拟 机 运行 效率 。 但 是 特定 情况 下 ,可 能 需要 手工 调整 参数 ,来 实现 
虚拟 机 正常 运行 或 优化 虚拟 机 运行 时 的 表现 。 例 如 ,第 9 章 的 部 分 例子 需要 将 虚拟 化 完全 关 
闭 才能 正确 执行 。 这 说 明 在 使 用 硬件 虚拟 和 半 虚 拟 化 接口 时 ,VirtualBox 的 虚拟 机 可 能 不 能 
百分之百 地 像 物 理 机 器 那样 执行 程序 。 


10.3 模拟 器 Bochs 的 使 用 


本 节 简 单 介绍 在 Windows 平台 上 使 用 模拟 器 软件 Bochs。 利 用 Bochs, 能 够 运行 7.4 节 
介绍 的 加 载 器 ,从 而 建立 调试 和 运行 第 8 章 和 第 9 章 示例 程序 的 环境 。 在 这 个 环境 中 ,也 可 以 
调试 和 运行 由 读者 自己 编写 的 源 程 序 生 成 的 纯 二 进 制 目标 代码 。 关 于 Bochs 的 详细 介绍 ,请 
参阅 官方 使 用 手册 。 





10.3.1 Bochs 简介 


Bochs 是 一 个 高 度 可 移植 的 开源 I[A-32(x86)PC 模拟 器 , 它 自身 由 C++ 编写 实现 ,可 以 在 
最 流行 的 平台 上 运行 。 它 包括 IA-32 系列 CPU 仿真 .常用 的 1/O 设备 和 一 个 自 定 义 的 BIOS。 
Bochs 可 以 模仿 多 种 IA-32 处 理 器 ,从 早先 的 Intel 80386 到 最 近 的 Intel IA-64 和 AMD 处 理 
器 。Bochs 能 够 以 模拟 方式 提供 大 多 数 的 操作 系统 环境 ,包括 Linux、Windows 或 DOS。 

Bochs 有 多 种 用 途 。 在 不 需要 新 设备 或 重启 当前 设备 的 前 提 下 ,可 以 运行 第 二 个 操作 系 
统 ,使 得 用 户 能 够 在 模拟 的 硬件 环境 中 运行 程序 。 利 用 Bochs, 可 以 调试 新 的 启动 引导 程序 、 
新 的 操作 系统 和 硬件 驱动 程序 ,因为 它 可 以 模拟 执行 每 一 条 硬件 指令 。 

1. 获取 

获取 Bochs 的 最 好 方法 是 访问 官方 网 站 。Bochs 的 代码 托管 在 Sourceforge 上 ,访问 http:// 
bochs. sourceforge. net, 可 以 下 载 到 Bochs 的 发 行 版 本 、 使 用 文档 和 源 代码 等 。 面 向 不 同 的 操作 系 
统 平台 ,有 不 同 的 版 本 ,从 文件 名 中 可 以 发 现 对 应 操作 系统 的 标记 。 每 个 发 行 版 本 还 有 安装 程序 
和 免 安 装 压 缩 包 两 种 文件 形式 。 截 至 本 书 编写 时 Bochs 的 较 新 发 行 版 本 为 2. 6. 8。 

如 果 需 要 在 Windows 平台 上 和 运行 Bochs, 而 且 采 用 安装 方式 ,那么 应 从 上 述 官方 网 站 下 
载 较 新 发 行 的 安装 程序 Bochs-2. 6. 8. exe。 本 节 将 以 2. 6. 8 的 Windows 安装 版 本 为 例 进行 
介绍 。 

2. 安装 

Bochs 的 安装 较为 简单 。 可 以 把 Bochs 安装 在 任意 目录 ,在 完成 安装 后 也 不 需要 重启 系 
统 。 图 10. 14 所 示 是 选择 安装 组 件 的 界面 ,用 户 可 以 根据 需要 选择 组 件 。 可 选 安装 的 组 件 包 
括 说 明文 档 、 示 例 模拟 器 和 快捷 方式 等 。 图 10. 15 是 安装 过 程 中 选择 文件 夹 的 界面 。 


Choose Components 
Choose which features of Bochs 2.6.8 you want to install. 侣 


Check the components you want to install and uncheck the components you don't want to 
install. Click Next to continue. 











Select the type of install: Normal 世 
Or, select the optional Bochs Program (required) 
components you wish to ROM Images (required) 
Install: 回 Documentation in HTML 
DW Linux Demo 


回 Add Bochs to the Start Menu and Desktop 
Register .bxrc Extension 


Space required: 9.4MB 











Nullsoft Install System v2,46 




















图 10.14 选择 安装 组 件 的 界面 


在 安装 过 程 中 ,如 果 没 有 特别 需要 ,几乎 都 可 以 直接 选择 默认 的 设置 。 
在 安装 完成 后 ,在 安装 文件 夹 中 含有 简单 的 说 明 , 还 有 配置 文件 样 例 。 当 然 , 还 有 如 下 分 
别 代表 模拟 器 和 调试 器 的 应 用 程序 文件 。 
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bochs. exe 
bochsdbg exe 


Choose Install Location 
Choose the folder in which to install Bochs 2.6.8. 





Setup will install Bochs 2.6.8 in the following folder. To install in a different folder, dick 
Browse and select another folder. Click Install to start the installation. 


Destination Folder 





Space required: 9.4MB 
Space available: 240.5GB 


Nullsoft Install System v2.46 



































图 10.15 安装 过 程 中 选择 文件 夹 的 界面 


10.3.2 Bochs 的 配置 与 运行 


1. 环境 配置 

为 了 模拟 多 种 软 硬 件 系统 环境 ,Bochs 支持 对 模拟 环境 的 配置 。 它 可 以 配置 的 模拟 环境 
包括 : CPU 硬盘 .光驱 和 BIOS, 还 包括 显卡 和 声卡 。 它 还 可 以 配置 调试 模式 .日 志 等 Bochs 
提供 的 软件 功能 。 

在 安装 之 后 ,初次 运行 时 ,必须 先 配置 Bochs 需要 模拟 的 软 硬 件 环境 。 通 过 调整 反映 模拟 
环境 的 若干 选项 或 参数 的 值 ,来 实现 环境 的 配置 。 可 以 把 环境 参数 保存 到 配置 文件 中 ,以 方便 
使 用 。 像 启动 其 他 应 用 程序 一 样 ,通过 双击 文件 夹 中 的 应 用 程序 bochs. exe, 或 者 对 应 的 快捷 
按钮 , 便 可 启动 模拟 器 Bochs。 采 用 这 种 方式 启动 ,模拟 器 将 弹出 控制 台 窗口 ,同时 还 会 弹出 
如 图 10. 16 所 示 的 启动 窗口 。 这 时 ,可 以 直接 配置 模拟 环境 ,也 可 以 通过 装载 已 经 存在 的 配置 
文件 来 配置 环境 ,还 可 以 把 当前 环境 参数 保存 到 配置 文件 。 


Edit Options 





CPUID 二 
Memory 
Clock & CMOS 


Display & Interface 

Keyboard & Mouse 
Serial /Paralel /USB 
Netwark card 

Sound card 

Dther 必 


10. 16 ”Bochs 的 启动 窗口 
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简单 起 见 , 只 需要 配置 虚拟 硬盘 文件 和 启动 顺序 ,其 他 环境 参数 可 以 采用 默认 设置 值 。 从 
图 10. 16 可 知 , 中 间 部 位 的 Edit Options 区 域 中 ,有 个 Disk& Boot 选项 , 它 对 应 磁盘 和 启动 顺 
序 等 参数 。 在 双击 Disk&Boot 选项 之 后 ,将 出 现 接近 图 10. 17 所 示 的 磁盘 参数 配置 界面 。 




























































































Floppy Options| ATA channel0 | ATA channel 1 [ ATA channel2 | ATA channel 3 | Boot Options 
ATA channel 0| Frst HD/CD on channel0 | Second HD/CD on channel 0 
wine 区 
Path or physical device name none |_ Browse 
Type of dsk image FREE 
Stalus [eected =] 
Path of journal fle none Browse. 
Cylinders [| 
Heads 0 
Sectors per track 0 
Model name Generic 1234 
BIOS Detection [wo 7-] 
Translation type [auo ~ 








图 10.17 磁盘 参数 配置 界面 


第 一 步 , 设 定 虚 拟 硬盘 文件 。 在 依次 单 击 ATA channel 0 标签 和 First HD/CD on 
channel 0 标签 后 ,将 出 现 如 图 10. 17 所 示 界 面 。 首 先 ,将 Type of ATA device 选项 从 none 改 
为 disk, 表 示 模 拟 环境 中 存在 硬盘 。 然 后 , 单 击 Path or physical device name 后 的 Browse 按 
钮 ,选择 虚拟 硬盘 文件 。 这 时 ,可 以 选择 已 经 准备 好 的 虚拟 硬盘 文件 。 在 10. 2 节 中 介绍 了 利 
用 虚拟 机 管理 器 VirtualBox 创建 VHD 类 型 的 虚拟 硬盘 文件 。 注 意 ,在 查找 虚拟 硬盘 文件 时 ， 
可 能 需要 将 过 滤 文 件 改 为 All files, 这 样 才 能 找到 VHD 格式 的 文件 。 

第 二 步 , 设 定 启动 顺序 。 如 图 10. 17 所 示 , 单 击 Boot Options 标签 ,并 将 Boot Drive #1 
设置 为 disk, 如 图 10. 18 所 示 。 通 过 这 一 步 ,确保 第 一 启动 设备 就 是 刚才 设置 的 虚拟 硬盘 。 

最 后 , 单 击 OK 按钮 保存 设置 ,返回 到 图 10. 16 所 示 的 启动 窗口 。 

为 了 方便 下 次 启动 时 使 用 ,在 配置 好 模拟 环境 后 ,应 该 把 环境 参数 保存 到 配置 文件 中 。 如 
图 10. 16 所 示 ,只 需要 单 击 左 侧 的 Save 按钮 ,就 可 以 把 当前 模拟 环境 参数 保存 到 指定 的 配置 
文件 中 。 默 认 的 配置 文件 名 为 bochsrc. bxrc。 注 意 , 配 置 文件 的 扩展 名 应 该 是 . bxrc。 为 了 方 
便 使 用 ,建议 把 配置 文件 安排 在 相关 工作 目录 中 。 

2. 模拟 器 的 运行 

第 一 种 启动 模拟 器 的 方式 如 上 所 述 。 通 过 双击 代表 模拟 器 的 应 用 程序 bochs. exe, 或 者 
对 应 的 快捷 按钮 ,启动 模拟 器 。 这 时 出 现 如 图 10. 19 所 示 的 控制 台 窗 口 和 如 图 10. 16 所 示 的 
启动 窗口 ,而 且 启 动 窗口 覆盖 在 控制 台 窗 口 之 上 。 
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Bochs Disk Options 
[lopey Options | ATA channel 0 [ ATA channel 1 .| ATA channel2 [ ATA channel3] Boot Options | 
Boot dive #1 disk 
Boot dive #2 none = 
Boot dive #3 none 四 
Skip Floppy Boot Signature Check 
Which operating system? [none 
none Br 
ne Bra 
none Biro 
图 10.18 设置 第 一 启动 设备 为 硬盘 























独 Bochs for Windows 





Built from SUN snapshot on May 
Compiled on May 





- Console 


Bochs x86 Emulator 2.6.8 
3, 2015 
2915 at 10:02:21 








通过 启动 窗口 ,可 以 加 载 本 
加 载 相应 的 配置 文件 ; 然后 单 





第 二 种 启动 模拟 器 的 方式 是 ,直接 双 庆 


图 10. 19 模拟 器 的 初始 控制 台 


忆 置 文件 。 在 如 图 10. 16 所 示 的 启动 窗口 中 , 单 击 Load 按钮 ， 
二 Start 按钮 ,启动 模拟 器 。 
此 扩展 名 为 . brxc 的 配置 文件 。 这 类 似 于 通过 双击 





扩展 名 为 . docx 的 Word 格式 的 文件 ,启动 Word 程序 。 由 于 已 经 指定 配置 文件 ,因此 不 再 出 


现 启 动 窗口 。 
当然 ,上 述 两 种 启动 方式 的 
3. 模拟 器 的 关闭 





模拟 器 的 关闭 像 结束 其 他 程序 的 运行 一 样 ,随时 可 以 关闭 模拟 器 。 


就 意味 着 关闭 模拟 器 。 
4. 使 用 实例 
下 面 举例 说 明 模 拟 器 Boc 


前 提 是 已 经 准备 好 配置 文件 。 


只 要 关闭 控制 台 窗口 ， 


hs 的 使 用 。 假 设 已 经 利用 10. 2 节 介 绍 的 虚拟 机 管理 器 


VirtualBox 创建 好 虚拟 硬盘 文件 , 设 对 应 的 虚拟 硬盘 文件 是 VM_ASM. vhd。 
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【 例 10-9】 利用 模拟 器 Bochs, 加 载 并 运行 第 7 章 的 示例 程序 dp78. asm。 

操作 步骤 如 下 。 

(1) 利用 工具 VHDWriter, 把 7.4 节 的 加 载 器 dp77 的 纯 二 进 制 目标 代码 loader, 写 到 虚 
拟 硬盘 文件 VM_ASM. vhd 的 0 扇 区 (引导 扇 区 )。 如 果 引 导 扇 区 已 经 含有 这 个 加 载 器 ,那么 
可 以 跳 过 该 步 。 

(2) 利用 工具 VHDWriter, 把 示例 程序 dp78. asm 的 纯 二 进 制 目 标 代码 , 写 到 虚拟 硬盘 文 
件 VM_ASM. vhd。 假 设 从 第 168 扇 区 开始 存放 。 如 果 已 经 存在 需要 运行 的 目标 代码 ,可 以 
跳 过 。 

(3) 启动 模拟 器 。 具 体操 作 如 上 所 述 , 如 果 需 要 ,可 以 配置 模拟 环境 。 

这 时 将 出 现 如 图 10. 20 和 图 10. 21 所 示 的 两 个 窗口 。 


图 10. 20 所 示 的 是 控制 台 窗 口 ,在 正常 运行 时 ,用 于 显示 模拟 器 的 运行 信息 ; 在 调试 模式 
下 ,用 于 控制 模拟 器 ,调试 运行 中 的 程序 。 
图 10. 21 所 示 的 是 显示 窗口 。 显 示 窗 口 由 三 部 分 构成 ,分 别 是 工具 栏 .模拟 显示 器 和 状态 


显示 栏 。 其 中 模拟 显示 器 显示 的 内 容 和 真 机 一 样 ,根据 屏幕 分 辩 率 不 同 会 自动 调整 窗口 大 小 ， 
显示 内 时 更 新 ,犹如 一 个 真实 的 显示 器 。 

注意 ,显示 窗口 中 模拟 显示 器 内 的 最 后 一 行 , 这 是 由 加 载 器 发 出 的 提示 信息 。 为 了 运行 已 
经 写 到 模拟 硬盘 文件 第 168 扇 区 开始 的 目标 代码 ,只 要 输入 168 即 可 。 当 然 , 如 果 需 要 运行 事 
先 写 到 模拟 硬盘 文件 上 其 他 的 目标 代码 ,也 可 以 输入 其 他 扇 区 号 。 


登 Bochsfor Windows - Console 


60600022176002i[BI0S RACPI tables: RSDP addr=9x999fa6ag ACPI DATA add 
Size:Qxf?2 





























Firmware Making uector 9x1ff99cc 
i449FX PMC write to PAM register 59 (TLB Flush) 
[2 
00002350674i[UBIOS ] UGABios $Id: ugabios.c,u 1.76 2013/62/10 88:07:03 uruppert 
Exp $ 
00002350759i[BXUGA ] UBE known Display Interface becO 
00002350778i[BXUGA ] UBE known Display Interface bgc5 
96692353762i[UBIOS UBE Bios $Id: ube.c,u 1.65 2914/67/98 18:02:25 uruppert Exp 
二 


y 

90602698154i[BI0S atag-9: PCHS=341/16/63 translationznone LCHS=341/16/63 
696996575373i[BI0S IDE time out 

960918723002i[BI0S Booting from 9999:7c99 














图 10. 20 ”模拟 器 的 控制 台 窗口 


5. 配置 文件 

综 上 所 述 ,Bochs 利用 配置 文件 来 保存 所 模拟 环境 参数 和 自身 设置 。 除 了 在 启动 时 ,由 启 
动 窗口 开始 ,以 图 形 化 界面 修改 和 保存 配置 文件 外 ,还 可 以 直接 编辑 配置 文件 。 

Bochs 的 配置 文件 是 以 行为 单位 的 文本 文件 ,通常 每 一 行 设 定 一 个 配置 参数 。 配 置 文件 
以 . bxrc 作为 扩展 名 。 常 用 的 配置 文件 名 称 为 bochsrc. bxrc。 用 户 可 以 利用 文本 编辑 工具 编 
辑 修改 配置 文件 。 

下 面 简 单 介绍 配置 文件 中 几 个 重要 的 硬件 配置 参数 。Bochs 可 配置 的 参数 众多 ,有 兴趣 
的 读者 可 以 参阅 官方 说 明文 档 (Bochs 安装 目录 中 自 带 )。 

(1) boot。 设 置 启动 设备 和 启动 顺序 。 启 动 设备 可 以 是 磁盘 、 光 驱 和 软驱 ; 启动 顺序 可 以 
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铭 BochsforWindows - Display mn | lie) 2 


商 商 站 你 当 各 省 获 T 








1 Z014 
Uy L6PL 
' 
ochs.sourcef orge .net 
~ http://uuu.nongnu .org/vgabios 


plau ndapter enabled 


，26. Dez 2914] $ 
pnpbios eltorito rombios32 


latae master: Generic 1234 ATA-6 Hard-Disk ( 168 MBytes) 


press F12 for boot menu. 


lBooting from Hard Dis 
Imput sector addl 








CTRL + 3rd button enat IPS: 104.£NUN-APSSCRLD:0 
图 10.21 模拟 器 的 显示 窗口 


按 需 任意 组 合 。 例 如 : 
boot: disk 
boot: odrom floppy, disk 
(2) cpu。 设 置 模拟 CPU 的 性 能 参数 ,包括 数量 和 处 理 能 力 、 型 号 等 。 其 主要 参数 有 : 
count 模拟 处 理 器 个 数 \ips 模拟 每 秒 处 理 指 令 数 (与 模拟 的 CPU 型 号 有 关 )、model 给 出 CPU 
型 号 。 例 如 : 
cpu: count= 2 ips= 10000000 model= bx_generic 
(3) cupid。 设 置 模拟 CPU 的 特性 。 其 主要 参数 有 : level 给 出 CPU 级 别 .family 表示 处 
理 器 家 族 .model 给 出 处 理 器 型 号 .mmx 给 出 MMX 指令 集 特 性 、x86_64 表示 64 位 等 。 当 上 
述 配置 参数 cpu 被 设 为 bx_generic 时 , 则 cpuid 配置 失效 ,自动 使 用 默认 人 参数。 例如， 
cpuid: yx 64- 1, mme 1 
cpuid: family= 6 model= Oxla, steppine= 5 
(4) memory 或 megs。 设 置 模拟 的 物理 内 存 大 小 ,以 MB 为 单位 。 采 用 memory 需要 分 
别 设置 客户 机 (guest) 的 内 存 和 宿主 机 (host) 可 用 的 内 存 。 采 用 megs 将 两 者 设置 成 相同 大 
小 。 例 如 : 
memory: gyest= 128, host= 25%6 
mgs: 2 
(5) ata0 到 ata3。 设 置 0 一 3 号 ATA 硬盘 接口 通道 ,相关 参数 包括 : 是 否 使 用 通道 IO 
地 址 和 中 断 号 。 例 如 : 
ata0: enabled 1, ioaddrf= (x1f0, ioaddr 关 3f0, irq: 4 
(6) ata0-master 到 ata3-master、ata0-slave 到 ata3-slave。 设 置 0 一 3 号 ATA 通道 主 从 设 
备 信息 ,相关 参数 包括 : 模拟 的 设备 类 型 空间 大 小 、 模 拟 设 备 的 文件 定位 、 硬 盘 参 数 信息 等 。 
例如 : 





484 ， 新 概念 汇编 语言 





ata0- master: type= disk，patrF NB. img mode= undoable, 
cylinders= 14563, heads= 16 spt= 63 translatiorF lba 
ata2- slave: type= cdram pathF iso. sanple, status= inserted 
虽然 利用 文本 编辑 工作 可 以 编辑 修改 配置 文件 ,但 是 需要 十 分 熟悉 各 项 配置 的 参数 和 名 
称 等 ,难度 较 大 。 通 过 启动 窗口 ,利用 图 形 化 界面 进行 配置 比较 方便 。 这 时 虽然 配置 参数 众 
多 ,但 实际 很 多 参数 并 不 需要 更 改 设置 ,采用 默认 值 即 可 。 


10.3.3 控制 台 调 试 


Bochs 最 强大 的 特性 是 调试 功能 。 它 可 以 类 似 于 VS2010 那样 ,调试 运行 目标 代码 ,包括 
单 步 执行 指令 .设置 断 点 查看 各 类 寄存 器 的 值 .查看 内 存 和 堆栈 中 的 数据 等 。 当 然 , 这 需要 在 
调试 模式 下 进行 ,也 即 运 行 Bochs 的 调试 器 。 

在 Bochs 的 安装 目录 中 , 除 Bochs 的 模拟 器 bochs. exe 外 ,还 有 Bochs 的 调试 器 
bochsdbg. exe。Bochs 支持 两 种 调试 器 操作 界面 : 一 种 是 控制 台 命 令 方式 ; 另 一 种 是 图 形 化 
界面 方式 。 下 面 简单 介绍 通过 控制 台 命令 进行 调试 的 方法 。 

1. 调试 器 的 运行 

启动 调试 器 的 方法 与 启动 模拟 器 的 方法 类 似 。 启 动 调试 器 时 ,也 需要 配置 文件 。 可 以 使 
用 与 模拟 器 相同 的 配置 文件 。 

现在 采用 第 一 种 方式 启动 调试 器 。 通 过 启动 窗口 , 装 和 人 配置 文件 ,启动 调试 器 ,可 得 如 
图 10. 22 所 示 的 控制 台 窗口 。 同 时 还 会 出 现 类 似 图 10. 21 所 示 的 显示 窗口 ,但 模拟 显示 器 区 
域 暂 时 没有 任何 内 容 , 就 像 机 器 还 没有 启动 ,屏幕 是 黑 的 那样 。 

从 图 10. 22 所 示 的 控制 台 窗口 可 知 ,配置 好 的 虚拟 机 已 经 准备 运行 ,将 要 执行 的 第 一 条 指 
令 位 于 F000:FFF0 处 ,是 一 条 无 条 件 转移 指令 。 早 先 的 PC 在 开机 时 也 是 从 这 个 地 址 开始 执 
行 。 在 如 图 10. 22 的 控制 台 窗口 中 ,有 一 个 操作 提示 符 < bochs:1 >, 其 后 还 有 一 个 光标 。 现 在 
用 户 可 以 通过 控制 台 窗 口 发 出 调试 命令 。 当 然 , 只 有 在 激活 控制 台 窗 口 的 情形 下 , 才 可 能 发 出 


调试 命令 。 















甸 Bochs for Windows - Console ey x] 
OOO00000000i [PLUGIN] reset of ‘usb uhci” plu y ， 避 
I00000000000i et SIGINT handler to b 


OxO000fffffff0] f000:fff0 (unk. 














图 10.22 ”调试 器 的 控制 台 窗口 (一 ) 


2. 调试 操作 实例 

下 面 演 示 几 条 调试 命令 的 使 用 ,同时 说 明 控 制 台 调试 操作 的 一 般 过 程 。 

【 例 10-10】 利用 Bochs 的 调试 器 ,调试 dp74. asm 的 目标 代码 。 

假设 在 配置 环境 时 指定 了 虚拟 硬盘 文件 VM_ASM. vhd, 并 且 其 引导 扇 区 ( 主 引 导 记 录 ) 
含有 dp74. asm 的 目标 代码 。 

启动 调试 器 (Bochsdbg) ,得 到 如 图 10. 22 所 示 的 调试 器 控制 台 。 然 后 实施 下 列 操作 。 

第 一 步 , 设 置 断 点 。 利 用 设置 断 点 命令 vb, 在 地 址 0:0x7c00 处 设置 断 点 。 


485 











第 10 章 ”实验 工具 的 使 














二 步 ,持续 执行 。 利 用 持续 执行 命令 c, 开 始 执 行 。 这 样 就 相当 于 启动 了 配置 好 的 一 台 
模拟 机 。 

两 步调 试 命令 的 操作 ,控制 台 如 图 10. 23 所 示 。 由 于 已 经 启动 了 模拟 机 ,这 时 的 显示 窗 
口 如 图 10. 21 所 示 ,但 其 模拟 显示 器 中 还 没有 最 后 一 行 操作 提示 信息 


[要 bodns for Windows - Console 5 
I00000000000i[ set SIGINT handler to bx_ debug ctrlc handler [ 








FFf0 (unk. ctxt): jmpf 0xf000:e05b ; ea5be000| 








图 10.23 调试 器 的 控制 台 窗 口 (二 ) 


在 执行 上 述 操 作 后 ,控制 台 如 图 10. 24 所 示 。 从 图 中 可 知 ,现在 执行 流程 暂停 在 地 址 
0000:7C00 处 。 实 际 上 ,在 第 一 步 设置 了 断 点 。 据 7. 2. 3 节 的 介绍 ,在 PC 启动 的 过 Es 
BIOS 将 读 取 主 引导 记录 到 起 始 地 址 为 0000:7C00H 的 内 存 区 域 ,并 转 到 主 引导 程序 。 这 也 是 
为 什么 会 踩 到 这 个 断 点 的 原因 


Ee for Windows - Console Ex | 
] IDE time out 
0001 784 42 208i [B I0S ] Booting from 0000:7c00 
(0) Breakpoint 1，in 0000:7c00 (0x00007c00) 
Next at t=17844263 
(0) [0x000000007c00] 0000:7c00 (unk. ctxt): mov bh, Ox00 ; b700 
bochs:3 








图 10. 24 调试 器 的 控制 台 窗 口 ( 三 ) 


根据 前 面 的 假设 ,被 装载 到 0000:7C00 开始 处 的 引导 代码 应 该 是 示例 程序 dp74. asm 的 
目标 代码 。 真 是 这 样 吗 ? 利用 反 汇 编 指令 ,可 以 查看 
第 三 步 , 反 汇编 。 利 用 反 汇 编 命令 u, 观 察 从 0000:7C00 处 开始 的 部 分 指令 。 调 试 命令 及 
结果 如 图 10. 25 所 示 ,其 中 要 求 反 汇 编 6 条 指令 。 对 比 dp74. asm 的 源 代码 可 知 ,确实 已 经 把 
其 dp74 的 目标 代码 装载 到 0000:7C00 开始 的 内 存 区 域 了 。 





[二 boceforWnd “Console 一 局 语 
] 0000:7c00 (unk. ctxt) : mov bh，0x00 
: mov bh, Ox00 


: mov dh, Ox( 
: mov 


: mOV a 
: int Ox ; cdl0 
: cld FR 











图 10.25 调试 器 的 控制 台 窗 口 (四 ) 
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他 全 


命令 s 命令 


第 四 步 ,跟踪 执行 。 利 用 单 步 或 者 步 进 命令 





试 命令 
差异 。 


bp, 可 以 跟踪 执行 这 
> 和 被 调试 指令 执行 结果 如 图 10. 26 所 示 。 细 心 的 读者 可 以 发 现 s 命令 和 p 命令 的 


个 引导 程序 。 调 





人 
| 名 Bochs for Windows - Console 





] 0000:7c02 (un 


Ox000000007¢ 
hs:6> p 

at t=17844267 
Ox000000007c08 


06] 0000:7¢ 


0000:7c08 (unk. ctxt): int Ox10 


有 (0o) 


ext at t=17844535 
(0) 000000007c0a] 
bochs:8 


0000:7c0a (ur 





x | 








图 10.26 调试 器 的 控制 台 窗 口 (五 ) 


这 时 ,可 以 利用 reg 命令 观察 寄存 器 的 内 容 , 也 可 以 利用 x 命 


而 了 解 执行 相关 指令 后 的 结 果 。 当 然 ,从 显示 窗口 中 模拟 显示 器 上 
果 。 虽 然 目 前 执行 的 几 条 指 4， 不 会 产生 明显 的 显示 效果 ， 和 
标 (8,5) 处 的 光标 。 

第 五 步 , 再 次 持续 执行 。 如 果 再 次 发 出 持续 执行 命令 c, 那 么 


程序 ,模拟 显示 器 中 的 坐标 (8.5) 处 ,将 出 现 hello 提示 信息 


提示 符 , 显 示 窗 口中 的 模拟 显示 器 似乎 也 没有 反应 。 分 析 en asm 


是 可 以 看 到 


令 观 察 内 存单 元 的 内 容 , 从 
,可 以 观察 到 实际 执行 的 效 
, 那 就 是 


-点 点 :从 


就 继续 执行 这 个 所 谓 的 引导 
。 但 是 ,控制 台 窗口 不 再 出 现 输入 


的 源 程序 可 知 , 这 是 在 模 























拟 反 复 执行 指令 *JMP Over”, 从 而 显然 导致 了 无 限 循环 。 在 控制 台 窗 口上 , 按 CTRL 十 C 组 
合 键 , 可 以 强行 中 止 。 
第 六 步 , 关 闭 调试 器 。 只 要 关闭 调试 器 的 控制 台 窗口 ,就 意味 着 关闭 调试 器 ,显示 器 窗口 
也 同时 自动 关闭 。 
3. 调试 命令 
下 面 列 出 部 分 常用 的 调试 命令 ,利用 这 些 命令 ,可 以 在 控制 台 I 
(1) 执行 控制 命令 。 表 10. 1 列 出 了 执行 控制 命令 ,其 中 符号 1” 表示 “或 者 ” 
表 10.1 执行 控制 命令 
命 令 说 明 
c | cont | continue 持续 执行 
s| step [count] 单 步调 试 运行 count 条 指令 ,不 填 count 则 默认 运行 1 条 
步 进 调试 运行 count 条 指令 ,但 不 会 进入 子 程 序 和 中 断 处 理 程序 ,不 填 count 则 
p | n | next [Lcount] 默认 运行 1 条 
CtrlL-C 暂停 执行 并 返回 到 命令 行 提 示 符 界面 
q | quit | exit 退出 调试 模式 并 关闭 模拟 器 
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(2) 断 点 命令 。 表 10. 2 列 出 了 设置 断 点 命令 。 


命 令 


表 10.2 设置 断 点 命令 
说 明 





vb | vbreak seg:offset 


设置 一 个 虚拟 地 址 上 的 断 点 ,seg 为 段 值 ,offset 为 偏 移 ,两 者 都 可 以 使 用 
十 六 进 制 . 十 进 制 或 八进制 表示 





lb | lbreak addr 


设置 一 个 线性 地 址 上 的 断 点 ,addr 是 线性 地 址 ,可 以 使 用 十 六 进 制 , 十 进 
制 或 八进制 表示 





b | pb | break | pbreak 


设置 一 个 物理 地 址 上 的 断 点 ,addr 是 物理 地 址 ,可 以 使 用 十 六 进 制 , 十 进 

















addr 制 或 八进制 表示 
info ~ break 查看 所 有 断 点 信息 ,包括 编号 、 类 型 .是 否 有 效 和 地 址 等 信息 
bpe nn 设置 编号 为 n 的 断 点 为 有 效 
bpd nn 设置 编号 为 n 的 断 点 为 无 效 
d | del ldelete nn 删除 编号 为 n 的 断 点 


(3) 内 存 操作 命令 。 
定位 置 处 的 数据 。 


命 


学 


表 10. 3 列 出 了 内 存 操作 命令 。 利 用 它们 ,可 以 多 种 形式 查看 内 存 指 


表 10.3 内存 操作 命令 
说 明 





制 表示 。 


查看 线性 地 址 处 的 内 存单 元 内 容 。addr 是 线性 地 址 ,可 以 使 用 十 六 进 制 , 十 进 制 或 八 进 


n 代表 要 显示 内 存单 元 的 计数 值 , 默 认为 1 


u 代表 单元 大 小 ,默认 值 为 w 





b(bytes) 1 字 节 
h(halfwords) 2 字 节 
w(words) 4 字 节 

x /nuf addr g(giantwords) 8 字 节 

代表 显示 格式 ,默认 为 x 

x(hex) 十 六 进 制 形式 
dCdecimal) 十 进 制 形式 
uCunsigned) ”无 符号 十 进 制 形式 
o(octal) 八进制 形式 
t(binary) 二 进 制 形式 
cCchar) 字符 形式 

xp /nuf addr| 查看 物理 地 址 处 的 内 存单 位 内 容 , 选 项 和 参数 与 x 命令 一 样 





(4) 寄存 器 操作 命令 。 表 10.4 列 出 了 寄存 器 操作 命令 


。 利 用 它们 可 以 查看 或 修改 CPU 








各 类 寄存 器 的 内 容 。 
表 10.4 寄存 器 操作 命令 
命令 说 明 
r | reg | regs | registers | 列 出 所 有 整 型 寄存 器 及 其 内 容 
sreg 列 出 所 有 眉 寄 存 句 及 其 内 容 








creg 


列 出 所 有 控制 寄存 器 及 其 内 容 











续 表 
命令 说 明 
info cpu 获取 CPU 所 有 寄存 器 及 其 内 容 
i 修改 CPU 寄存 器 的 值 ,可 以 使 用 表达 式 赋值 。 暂 时 只 支持 修改 通用 寄存 器 和 
OE 指令 指针 寄存 器 





(5) 反 汇 编 操 作 命 令 。 表 10. 5 列 出 了 反 汇 编 操作 命令 。 反 汇编 是 指 将 内 存单 元 的 内 容 
作为 机 器 码 , 以 汇编 格式 指令 的 形式 ,查看 内 存单 元 的 内 容 。 利 用 反 汇编 命令 ,可 以 查看 指定 
内 存 区 域 的 指令 。 

表 10.5 反 汇编 操作 命令 
命令 说 明 
u [/n] 反 汇编 从 当前 运行 位 置 开 始 的 n 条 指令 , 缺 省 n, 反 汇编 当前 位 置 的 1 条 指令 
u start end | 反 汇编 从 地 址 start 到 end 范围 内 的 指令 ,start 和 end 使 用 线性 地 址 表示 
u /n start 反 汇 编 从 地 址 start 开始 的 n 条 指令 
设置 当前 反 汇编 的 段 模式 ,n 可 以 为 16、32 或 64 
错误 设置 段 模式 ,可 能 导致 不 正确 的 反 汇编 结 果 














uy sise=nn 





10.3.4 图形 化 界面 调试 


控制 台 命令 调试 方式 ,功能 虽然 强大 ,但 不 够 直观 ,为 此 Bochs 提供 了 图 形 化 界面 调试 方 
式 。 利 用 图 形 化 界面 调试 程序 ,应 该 会 更 直观 和 方便 。 

1. 启动 

为 了 启用 图 形 化 界面 调试 方式 ,需要 修改 配置 文件 中 的 一 个 配置 项 。 假 设 已 经 存在 某 个 
配置 文件 bochsrc. bxrc。 生 成 新 配置 文件 的 操作 步骤 如 下 。 

(1) 利用 文本 编辑 工具 打开 原配 置 文件 ; 

(2) 找到 工作 参数 “display_library” 所 在 行 ,将 该 行 修改 为 如 下 内 容 : 

display_library: win32，options= " gui_debug" 

(3) 另存 一 个 配置 文件 。 假 设 新 的 配置 文件 为 bochsG. bxrc。 实 际 上 启用 图 形 化 界面 调 
试 方式 的 配置 文件 ,不 能 用 于 控制 台 命令 调试 方式 ,也 不 能 用 于 普通 运行 模式 ( 非 调 试 模式 ) 。 

在 准备 好 支持 图 形 化 界面 的 新 配置 文件 后 ,就 能 够 利用 图 形 化 界面 进行 调试 操作 。 

在 启动 调试 器 (Bochsdbg) 时 ,如 果 选 择 支 持 图 形 化 界面 调试 方式 的 配置 文件 (如 上 述 的 
bochsG. bxrc) , 即 可 建立 图 形 化 调试 界面 。 这 时 出 现 如 图 10. 27 所 示 的 图 形 化 调试 窗口 。 当 
然 ,控制 台 窗口 和 显示 窗口 仍然 会 出 现 。 

2. 图 形 化 界面 

下 面 对 图 形 化 界面 作 简 要 说 明 。 从 图 10. 27 可 知 , 图 形 化 调试 控制 台 包 含 5 个 功能 区 域 ， 
从 上 到 下 分 别 是 : 菜单 、 执 行 控制 按钮 多 功能 信息 框 、 命 令 执行 区 和 状态 栏 。 与 控制 台 方 式 
相 比 ,图 形 化 界面 要 直观 得 多 。 

(1) 菜单 区 域 包 含 命令 (Command) 、 视 图 (View) .选项 (Options) 和 帮助 4 个 菜单 。 命 令 
菜单 包含 了 常用 的 执行 控制 命令 ,还 支持 内 存 查看 内存 内 容 查找 和 刷新 数据 等 功能 。 视 图 菜 
单 用 于 选择 或 切换 显示 多 功能 信息 框 中 的 内 容 。 例 如 ,选择 堆栈 (Stack) 选 项 , 则 在 最 右 侧 的 
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® Bochs Enhanced Debugoer 二 村 
Command Yew Options Help 
Conineeld | Se 加 Step Nis 2824] Retesh | Bearg |] 

Reg N... Hex Value Decimal “| LAddre.. Bytes Mnemonic A 20,1234 .56.42 
eax 00000000 0 fffffffo (5) EAS.. jmpf 0xf000:e05b | 

ebx 00000000 0 fffffff5 (2) 3034 xor byte ptr dsfsil, dh 

ecx 00000000 0 ffffff7 (D2F das 

edx 00000000 0 fffffffg (2)3138 xorword ptr ds:[bx+sil, di 

esi 00000000 0 fffffffa (1)2F das 

edi 00000000 0 fffffffb (2) 3135 xorword ptr ds:[dil, si 

ebp 00000000 0 fffffffd (2) 00FC addah,bh 

esp 00000000 0 ffffffff (2) 0C00 or al 0x00 

ip 0000fff0 65520 00000001 (2) 0000 ”add byte ptr ds:[bx+sil, al 

eflags 00000002 00000003 (2) 0000 add byte ptr ds:[bx+si], al 

cs f000 00000005 (2) 0000 ”add byte ptr ds:[bx+si], al 

ds 0000 00000007 (2) 0000 ”add byte ptr ds:[bx+si], al 
| es 0000 .| 00000009 (2) 0000 ”add byte ptr ds:[bx+sil,al - 

4 1 » | :| 
| 
[em CPU: Real Mode 16 t=0 IOPL=0 id vip vif ac vm rf nt of df if tf sf zf af pf cf 




















图 10.27 图 形 化 调试 控制 台 


信息 框 中 显示 堆栈 的 信息 。 选 项 菜单 用 于 设置 图 形 化 界面 自身 的 参数 。 

(2) 执行 控制 按钮 包括 持续 执行 (Continue) 、 单 步 (Step) 、 多 步 (Step N)、 刷 新 (Refresh) 
和 中 断 (Break) 。 按 这 些 按钮 ,表示 进行 对 应 的 控制 动作 ,也 即 实施 常用 的 调试 操作 。 

(3) 多 功能 信息 框 包含 以 下 3 个 子 框 。 

Q@ 寄存 器 子 框 。 它 位 于 左 侧 ,给 出 通用 寄存 器 、 段 寄存 器 .控制 寄存 器 和 其 他 CPU 特性 
寄存 器 的 内 容 , 可 以 在 选项 菜单 中 选择 是 否 显示 某 类 寄存 器 。 默 认 不 同类 型 的 寄存 器 用 不 同 
颜色 标注 。 双 击 选 中 的 寄存 器 ,可 以 修改 该 寄存 器 的 值 。 

@ 反 汇 编 子 框 。 它 位 于 中 间 ,默认 给 出 当前 (即将 执行 ) 指 令 附近 的 汇编 指令 信息 ,包括 
线性 地 址 、 机 器 码 和 汇编 格式 的 指令 。 当 前 指令 由 绿色 标 出 。 双 击 某 一 行 的 指令 可 以 对 该 行 
指令 添加 或 取消 断 点 , 断 点 处 的 指令 由 红色 斜体 标注 。 通 过 视图 菜单 的 反 汇 编 (Disassemble) 
选项 ,可 以 查看 指定 内 存 区 域 的 汇编 格式 指令 。 

@ 内 存 显示 子 框 。 它 位 于 右 侧 , 默 认 不 显示 内 容 。 通 过 视图 菜单 选项 ,可 以 选择 显示 某 
一 种 类 型 内 存 区 域 的 信息 ,包括 物理 地 址 内 存 、 线 性 地 址 内 存 、 堆 栈 、 全 局 描述 符 表 、 局 部 描述 
符 表 、 分 页 表 、 当 前 运行 内 存 、Bochs 参数 树 状 表 等 。 

(4) 命令 执行 区 包括 执行 结果 提示 区 和 命令 栏 。 在 暂停 状态 时 ,用 户 可 以 在 命令 栏 中 输 
入 Bochs 提供 的 各 种 调试 命令 , 回 车 表示 执行 调试 命令 ,执行 结果 在 提示 区 给 出 。 

(5) 状态 栏 反映 当前 执行 状态 。 它 包括 调试 器 状态 .CPU 工作 方式 .执行 指令 计数 和 标 
志 寄 存 器 (EFLAGS) 中 有 效 标志 的 状态 。 调 试 器 状态 分 为 暂停 (Break) 和 运行 (Running) 两 
种 ;CPU 工作 方式 分 为 16 位 实 方式 (Real Mode 16)、32 位 保护 方式 (Protected Mode 32) 等 ; 
执行 指令 计数 给 出 调试 器 启动 以 来 所 有 模拟 执行 指令 数量 ; 标志 寄存 器 中 有 效 标 志 采 用 大 小 
写 表示 状态 ,如 ZF 表示 零 标 志 为 1。 

3. 调试 操作 实例 

下 面 演 示 利 用 图 形 化 界面 调试 示例 程序 。 

【 例 10-11】 利用 Bochs 的 调试 器 ,调试 7. 4 节 示 例 程序 dp78. asm 的 纯 二 进 制 目标 
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代码 。 

假设 准备 好 了 支持 图 形 化 界面 调试 的 配置 文件 。 

假设 指定 了 虚拟 硬盘 文件 VM_ASM. vhd, 并 且 其 引导 扇 区 含有 7. 4 节 所 述 的 加 载 器 目 
标 代码 (Loader) ,同时 示例 程序 dp78. asm 的 目标 代码 已 写 入 到 该 虚拟 硬盘 文件 的 第 168 扇 
区 开始 的 存储 区 域 。 

启动 调试 器 (Bochsdbg) ,加 载 配置 文件 ,出现 图 10. 27 的 调试 器 控制 台 。 为 了 方便 表示 ， 
下 面 步 又 中 出 现 的 调试 命令 用 双 引 号 括 起 来 ,实际 操作 时 不 需要 引号 。 

第 一 步 ,在 命令 栏 中 发 出 设置 断 点 命令 “vb 0:0x7c00”。 

第 二 步 , 单 击 调试 控制 台 上 部 的 持续 执行 按钮 (Continue) ,或 者 在 命令 栏 发 出 持续 执行 命 
令 “c”。 这 时 的 调试 控制 台 如 图 10. 28 所 示 。 从 位 于 中 间 的 反 汇 编 子 框 可 见 ,加 载 器 (dp77 目 
标 代码 ) 的 部 分 汇编 格式 指令 。 























Continue lc Step sl Step N [s 4 人 _ Retresh ] Break [C} 
Reg N.. Hex Value Decimal “| LAddre.. Bytes Mnemonic 了 Address 0 1 2 3 4 5 6 
eax 0000aa55 43605 00007c00 (3) B80.. mov ax Ox0000 
00007c03 (DFA di 
00007c04 (2) 8ED0 mov ss, ax 
00007c06 (3) BC0.。 mov sp, 0x7c00 
00007c09 (DFB sti 
00007c0a (D FC dd 
00007cOb (1) OE push cs 
00007cOc (1) 1F popds 


























ip 00007c00 31744 00007c0d (3) B8E... mov ax, 0x07e0 
eflags 00000082 00007c10 (3) A37.. mov word ptr ds:0x7d73, ax 
cs 0000 00007c13 (2)8ECO moves,ax 


00007c15 (3) BA8. mov dx, 0x7d87 
00007c18 (3) E841... call.+321 (Ox00007d5c) 












» 


ke》 Breakpoint 1, in 8889:7c88 ‘Bx886897c88> 



































Break CpU:Real Mode 16 t= 17844263 IOPL=0 id vip vif ac vm rf nt of df if tf SF zf af pf cf 























10.28 图形 化 调试 控制 台 ( 加 载 器 一 ) 


第 三 步 , 单 击 调试 控制 台 上 部 的 单 步 按钮 (Step) ,或 者 在 命令 栏 发 出 单 步 命 令 *s”( 或 步 进 
命令 *p”)。 这 样 可 以 单 步 执 行 加 载 程序 (dp77)。 随 着 执行 . 反 汇编 子 框 中 由 绿色 标 出 的 当前 
指令 向 前 推进 ,同时 左 侧 寄存 器 子 框 中 寄存 器 的 内 容 会 相应 变化 。 

第 四 步 , 慢 慢 拖 动 位 于 反 汇 编 子 框 右 侧 的 垂直 滚动 条 ,使 得 线性 地 址 00007c8e 对 应 的 指令 
“callf es:0x0008? 出 现在 子 框 中 。 对 照 加 载 器 源 程序 dp77. asm 可 知 ,这 里 是 调用 方式 执行 被 加 
载 的 工作 程序 。 现 在 双击 该 指令 ,使 其 成 为 断 点 ,或 者 在 命令 栏 发 出 设置 断 点 命令 “lb 0x07c8e”。 

第 五 步 , 单 击 图 形 化 界面 左上 方 的 持续 执行 按钮 (Continue) ,或 者 在 命令 栏 发 出 持续 执行 
命令 “c”。 这 时 ,调试 控制 台 似乎 没有 反应 。 但 观察 状态 栏 可 以 发 现 ,调试 器 一 直 处 于 运行 状 
态 。 其 实 ,加 载 器 在 等 待 用 户 输入 要 加 载 的 工作 程序 所 在 的 起 始 扇 区 号 。 所 以 ,切换 到 显示 窗 
口 ,输入 示例 程序 dp78 目标 代码 所 在 的 起 始 扇 区 号 168。 这 样 操作 后 ,加 载 器 继续 运行 , 才 到 
达 上 述 第 四 步 所 设 的 断 点 ,调试 器 进入 暂停 状态 。 这 时 ,调试 控制 台 如 图 10. 29 所 示 。 

第 六 步 , 单 击 图 形 化 界面 上 方 的 单 步 按钮 (Step) ,或 者 在 命令 栏 发 出 单 步 命令 “*s"。 于 是 
就 进入 了 示例 程序 (dp78)。 这 时 调试 控制 台 如 图 10. 30 所 示 。 对 照 示例 程序 dp78. asm 的 源 
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em 




















Bochs Enhanced 

| Commend_ View_ Options Help 

Reg N... Hex Value Decimal “| LAddre... Bytes Mnemonic “|Address 0 1 2 3 4 5 6 
eaX 00000000 0 00007c7d (5) 66FF inc dword ptr ds:0x7d75 

ebx 00000000 0 00007c82 (3) E82... call .+44 (Ox00007cb1) 

ecx 00090000 589824 | 00007c85 (2) 7218 jb .+24 (0x00007c9f) 

edx 000000a8 168 00007c87 (2) E2EE loop .-18 (Ox00007c77) 

esi 000e0200 918016 | | 00007c89 (5) 268.. mov word ptr es:0x000a, es 

edi 00000200 512 00007c8e (5) 26FF... callf es:0x0008 

ebp 00000000 0 00007c93 (3) E974... jmp .-140 (0x00007c0a) 

esp 00007c00 31744 00007c96 (3) BA9.. mov dx, Ox7d9e 

ip O00007c8e 31886 00007c99 (3) E8C... call .+192 (0x00007d5c) 

eflags 00000206 00007c9c (3) E96. jmp .-149 (0x00007c0a) 

cs 0000 00007c9f (3) BAB... mov dx, Ox7db0 

ds 0000 00007ca2 (3) E8B.. call .+183 (0x00007d5c) 

es 1000 .| 00007ca5 (3) E962... jmp .-158 (0x00007c0a) 

‘ ， 区 Ci » 





kB) Breakpoint 1。 in 8889:7c88 ‘9x88897c88> 
9) Breakpoint 2 Gx8888888888887c8e in ?3? 《> 





box CPU: Real Mode 16 t= 1121822289 IOPL=0 id vip vif ac vm rf nt of df IF tf sf zf af PF cf 


10. 29 图 形 化 调试 控制 台 ( 加 载 器 二 ) 


代码 ,可 以 清楚 地 看 到 示例 程序 的 代码 出 现在 反 汇编 子 框 中 。 
































ep N [s a | Refresl Break [OC] | 
Mnemonic Address 0 123456 

00010019 (2) 8CC8 ”mov ax cs 

0001001b (2) 8ED8 mov ds, ax 

0001001d (DFC dd 

0001001e (3) BA1.. mov dx, 0x0010 

00010021 (3) E81... call .+28 (Ox00000040) 

00010024 (2) 8CCA mov dx, cs 

00010026 (3) B90. mov cx 0x0004 

00010029 (3) BE6.. mov si 0x0462 

0001002c (3) C1C... rol dx, 0x04 

0001002f (2) 88D0 moval dl 

00010031 (3) E81.. call .+29 (0x00000051) 

00010034 (2) 8804 mov byte ptr ds:[si], al 

00010036 (1) 46 





9》 Breakpoint 1, in 9898:7cB8 《“Bx89987c89: 
9》 Breakpoint 2, Bx8888888988887c! 











CPU: Real Mode 16 





10. 30 图 形 化 调试 控制 台 ( 示 例 程序 ) 


第 七 步 , 单 击 调试 控制 台 上 部 的 单 步 按钮 (Step) ,或 者 在 命令 栏 发 出 单 步 命令 “s”( 或 步 进 
命令 *p”) 。 继 续 单 步 执行 示例 程序 (dp78) 。 随 着 执行 , 反 汇 编 子 框 中 由 绿色 标 出 的 当前 指令 
向 前 推进 ,同时 左 侧 寄存 器 子 框 中 寄存 器 的 内 容 会 相应 变化 。 

第 八 步 ,激活 视图 菜单 ,选择 显示 线性 地 址 区 域 (功能 键 F7) 。 在 输入 开始 的 线性 地 址 后 ， 
可 以 在 右 侧 的 内 存 显示 子 框 中 ,看 到 相应 内 存 区 域 的 数据 。 

第 九 步 ,激活 视图 菜单 ,选择 显示 当前 堆栈 (功能 键 F2)。 这 时 在 右 侧 的 内 存 显示 子 框 中 ， 
可 以 看 到 当前 堆栈 的 内 容 , 从 中 可 以 发 现 返 回 地 址 等 。 
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第 十 步 , 单 击 调试 控制 台 上 部 的 持续 执行 按钮 (Continue) ,或 者 在 命令 栏 发 出 持续 执行 命 
令 “c”"。 这 样 持续 执行 示例 程序 (dp78)。 于 是 ,在 显示 窗口 中 ,可 以 看 到 类 似 于 图 10. 12 所 示 
的 相应 信息 。 但 是 ,调试 控制 台 似乎 失去 反应 ,但 从 状态 栏 的 “Running” 可 知 , 它 一 直 在 运行 。 
实际 上 ,示例 程序 执行 完毕 后 ,返回 到 了 加 载 器 。 

第 十 一 步 , 单 击 调试 控制 台 右 上 方 的 中 断 (Break) 按 钮 ,中 止 等 待 用 户 输入 的 过 程 ,使 得 控 
制 台 回 到 可 以 操作 的 暂停 状态 。 

第 十 二 步 , 在 命令 栏 发 出 退出 命令 “q”, 于 是 调试 器 被 关闭 。 


10.4 VHDWriter 的 使 用 


本 节 简 单 介绍 VHDWriter 工具 的 使 用 。 

VHDWriter 由 苏州 大 学 纵横 汉字 信息 技术 研究 所 朱 晓 旭 老 师 开 发 。VHDWriter 的 主要 
功能 是 把 纯 二 进 制 代 码 文件 写 入 由 VirtualBox 生成 的 固定 大 小 的 VHD 格式 虚拟 硬盘 文件 。 
VHDWriter 的 运行 界面 如 图 10. 31 所 示 。 从 图 中 可 知 , 用 户 可 以 指定 虚拟 硬盘 文件 ,还 可 以 
选择 写 人 到 虚拟 硬盘 文件 的 二 进 制 代码 文件 。 


























FVHD 信 息 
[到 关 到 | 
写 和 VHD 
选择 文件 … 
指定 麻 区 [ 也 写 元 
退出 说 明 


图 10.31 VHDWriter 启动 界面 


把 二 进 制 代码 文件 写 人 到 虚拟 磁盘 文件 的 步骤 如 下 。 

(1) 指定 虚拟 磁盘 文件 。 通 过 图 10. 31 中 上 面 的 “选择 文件 ”按钮 ,指定 虚拟 磁盘 文件 。 

(2) 选择 代码 文件 。 通 过 图 10. 31 中 下 面 的 “选择 文件 按钮 ,指定 要 写 人 到 虚拟 磁盘 的 
代码 文件 。 

(3) 确定 起 始 扇 区 。 由 起 始 扇 区 确定 代码 文件 被 写 人 到 虚拟 磁盘 的 位 置 。 这 里 的 扇 区 号 
是 逻辑 块 号 (LBA)。 主 引导 记录 (或 引导 程序 ) 应 该 位 于 首 个 扇 区 ,对 应 的 扇 区 号 是 0。 其 他 
示例 程序 的 存放 位 置 ,用 户 可 以 按 需 指定 ,但 要 注意 避免 相互 冲突 。 

(4) 写 信 操作。 在 指定 虚拟 磁盘 文件 ,并 选择 代码 文件 和 起 始 扇 区 后 , 按 “ 写 入 ”按钮 开始 
写 和 操作 ,也 即 把 所 选择 的 代码 文件 写 到 虚拟 磁盘 中 指定 的 扇 区 位 置 。 
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(5) 继续 写 入 其 他 代码 文件 。 如 果 还 有 其 他 需要 写 和 人 到 虚拟 磁盘 的 代码 文件 ,可 以 重复 
上 述 (2) 一 (4) 步 。 图 10. 32 给 出 了 写 人 加 载 器 (Loader) 和 示例 程序 (dp78. asm) 的 目标 代码 
文件 后 的 界面 。 

(6) 结束 运行 。 单 击 “ 退 出 ”按钮 ,可 以 结束 运行 。 

















指定 户 区 [55 ”一 当 。 共 3440s5 个 记 区 
|Sector [00000000-00000000] 恕 ader 
lSector [00000168-00000170] 了 :VIASWVdp76 














10.32 写 人 目标 代码 文件 后 的 界面 


[1] 
[2] 
[3] 
[4] 
[5] 
[2 
[8] 
[9] 
[10] 
[11] 
[12] 
[13] 
[14] 
[15] 
[16] 
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图 书 资源 支持 

















感谢 您 一 直 以 来 对 清华 版 图 书 的 支持 和 爱护 。 为 了 配合 本 书 的 使 用 ,本 书 
提供 配套 的 资源 ,有 需求 的 读者 请 扫描 下 方 的 “ 书 圈 " 微 信 公 众 号 二 维 码 , 在 图 
书 专区 下 载 ,也 可 以 拨打 电话 或 发 送 电子 邮件 咨询 。 

如 果 您 在 使 用 本 书 的 过 程 中 遇 到 了 什么 问题 ,或 者 有 相关 图 书 出 版 计划 ， 
也 请 您 发 邮件 告诉 我 们 ,以便 我 们 更 好 地 为 您 服务 。 



















































































我 们 的 联系 方式 : 


地  ” 址 : 北京 海淀 区 双 清 路 学 研 大 厦 A 座 707 
资源 下 载 、 样 书 申 请 





邮 编 : 100084 

电 话 : 010 一 62770175 一 4604 
资源 下 载 : http://www. tup.com.cn 
电子 邮件 : weijj@tup. tsinghua. edu. cn 
QQ: 883604( 请 写 明 您 的 单位 和 姓名 ) 


用 微 信 扫 一 扫 右 边 的 二 维 码 , 即 可 关注 清华 大 学 出 版 社 公 众 号 " 书 圈 ”。 


